3 Grundphänomene der Wahrnehmung von periodischem Rauschen

Werbung
Mechanismen des
Echogedächtnisses:
Studien mit periodischem Rauschen
als minimal strukturiertem Stimulus
Von der Fakultät für
Biowissenschaften, Pharmazie und Psychologie
der Universität Leipzig
genehmigte
H A B I L I TAT I O N S S C H R I F T
zur Erlangung des akademischen Grades
doctor habilitatus
(Dr. habil.)
vorgelegt
von Dr. Christian Kaernbach
geboren am 4. 10. 1960 in Bonn
Tag der Verleihung: 07. 06. 1999
Vorlage zum Nachdruck der Habilitationsschrift von Christian Kaernbach.
Diese Datei mit MS Word und dem Druckertreiber für den LaserJet III drucken,
wechselseitig kopieren, und das Papier auf 18 cm Breite und 23,6 cm Höhe beschneiden.
Die letzte bedruckte Seite sollte die Seitenzahl 160 tragen.
Gutachter:
Prof. Dr. Hans-Georg Geißler / Prof. Dr. Erich Schröger, Institut für
Allgemeine Psychologie, Universität Leipzig
Prof. Dr. Hans Colonius, Institut für Kognitionsforschung, Universität
Oldenburg
Prof. Dr. Rainer Mausfeld, Institut für Psychologie, Universität Kiel
Bibliographische Beschreibung:
Kaernbach, Christian
Mechanismen des Echogedächtnisses:
Studien mit periodischem Rauschen
als minimal strukturiertem Stimulus
Universität Leipzig, Habilitationsschrift
160 Seiten, 85 Lit., 35 Abb.
Die vorliegende Schrift beschäftigt sich mit den ersten Stufen der
Informationsverarbeitung beim Hören und den dabei auftretenden
Gedächtnisphänomenen. Nachdem die Interpretation dieser Vorgänge im
Sinne eigenständiger sensorischer Register zugunsten eines kontinuierlichen
Modells aufgegeben worden ist, findet sich heute zunehmend Evidenz für
eine Zweiteilung innerhalb der sensorischen Register. Cowan teilt diese in
kurze und lange Speicher, wobei die langen Speicher eine Variante des
Kurzzeitgedächtnisses für sensorische Inhalte darstellen.
Die Arbeit unternimmt den Versuch, das Erinnern sensorischer Information
am Beispiel desjenigen auditiven Stimulus zu untersuchen, der am
wenigsten Anlaß für eine nichtsensorische, kategoriale Kodierung der
Information bietet: Weißes Rauschen, ein minimal strukturiertes Signal. Die
gewonnenen Schlußfolgerungen weisen in einzigartiger Weise auf ein
wirklich sensorisches Gedächtnis hin, da bei sprachlichem oder
musikalischem Material eine höhere kognitive Verarbeitung nicht
auszuschließen, ja wahrscheinlich ist.
Zunächst werden die bei diesem Stimulus zu beobachtenden
Grundphänomene untersucht. In weiteren Experimenten gelingt der
Nachweis, daß bei einem einheitlichen Vorgang, nämlich dem Entdecken der
Periodizität langer Zyklen, einerseits eine Lebensdauer im Bereich von
mehreren Sekunden, aber andererseits eine Kapazitätsgrenze deutlich unter
einer Sekunde vorliegen. Mit Hilfe evozierter elektroenzephalographischer
Potentiale kann schließlich zwischen verschiedenen Modellvorstellungen
des Echogedächtnisses entschieden werden. Abschließend werden Bezüge
zu Modellen des Kurzzeitgedächtnisses und zum Paradigma des primings
hergestellt. Ein Anhang behandelt technische Fragen der Signalerzeugung.
1
Inhaltsverzeichnis
Vorwort........................................................................................................... 3
1 Sensorisches Gedächtnis im Kontext moderner Gedächtnistheorien ......... 6
2 Langer und kurzer auditiver Speicher ....................................................... 13
3 Grundphänomene der Wahrnehmung von periodischem Rauschen ......... 17
3.1 Rauschen als minimal strukturierter Stimulus .................................. 17
3.2 Klassische Versuche mit periodischem Rauschen ............................. 20
3.3 Experiment 1: Reproduzierbarkeit des Mittappens ........................... 23
I. Methodik ......................................................................................... 25
II. Ergebnisse ...................................................................................... 26
III. Zusammenfassung ........................................................................ 37
3.4 Holistische vs. lokale Verarbeitung von periodischem Rauschen ..... 38
3.5 Experiment 2: Temporale Eingrenzung ............................................. 40
I. Methodik ......................................................................................... 40
II. Ergebnisse ...................................................................................... 41
3.6 Experiment 3: Spektrale Eingrenzung............................................... 45
I. Methodik ......................................................................................... 45
II. Ergebnisse ...................................................................................... 48
3.7 Analyse des Spektrogramms ............................................................. 50
3.8 Auditive feature Detektoren .............................................................. 53
4 Lebensdauer des Echogedächtnisses ......................................................... 58
4.1 Lebensdauer: ein typischer Gedächtnisparameter ............................. 58
4.2 Experiment 4: Grenze der PR-Detektion für lange Zyklen ............... 59
I. Methodik ......................................................................................... 59
II. Ergebnisse ...................................................................................... 61
4.3 PR-Wahrnehmung: ein Phänomen des langen auditiven Speichers .. 64
5 Kapazität des Echogedächtnisses .............................................................. 68
5.1 Kapazität: eine Zeitkonstante? .......................................................... 68
5.2 Austausch von Segmenten zur Kapazitätsmessung ........................... 70
5.3 Experiment 5: Abhängigkeit von der Zykluslänge ............................ 75
I. Methodik ......................................................................................... 75
II. Ergebnisse ...................................................................................... 76
5.4 Experiment 6: Abhängigkeit von der Segmentlänge ......................... 78
2
I. Methodik .......................................................................................... 79
II. Ergebnisse....................................................................................... 80
5.5 Kapazität und kurzer Speicher: Koinzidenz oder Zusammenhang? .. 82
6 Mechanismen des Echogedächtnisses ....................................................... 86
6.1 Phänomene der PR-Wahrnehmung .................................................... 86
6.2 Restaktivierung versus sensorische Vorbereitung.............................. 88
6.3 Stimulusmaterial für EEG-Untersuchungen ...................................... 94
6.3.1 Periodisches und semiperiodisches Rauschen ........................... 94
6.3.2 Experiment 7: Detektierbarkeit von SPR................................... 95
I. Methodik ..................................................................................... 95
II. Ergebnisse .................................................................................. 96
6.4 Elektrophysiologische Überprüfung der Modelle.............................. 98
6.4.1 Experiment 8: Signifikanz einzelner Segmente ......................... 99
I. Methodik ..................................................................................... 99
II. Ergebnisse ................................................................................ 102
6.4.2 Experiment 9: Ereigniskorrelierte Potentiale zu SPR .............. 102
I. Methodik ................................................................................... 104
II. Ergebnisse ................................................................................ 106
6.5 NLN: Aktivierung sensorischer Verarbeitungsstufen ...................... 111
6.6 Ein Modell des Echogedächtnisses.................................................. 112
6.7 Echogedächtnis, priming und Repräsentation ................................. 119
Zusammenfassung ...................................................................................... 127
Anhang A: Erzeugung von digitalem Rauschen ......................................... 139
A.1 Digitalisierte Wellenformen ............................................................ 139
A.2 Digitales weißes Rauschen ............................................................. 140
A.3 Iteriertes (periodisches) Rauschen .................................................. 141
A.4 Zufallszahlen: Algorithmen ............................................................ 144
Literaturverzeichnis .................................................................................... 148
Erklärung .................................................................................................... 156
Lebenslauf und wissenschaftlicher Werdegang .......................................... 158
Veröffentlichungen ..................................................................................... 160
Einwerbung von Drittmitteln ..................................................................... 164
Register....................................................................................................... 166
3
Vorwort
Die vorliegende Schrift beschäftigt sich mit den ersten Stufen der
Informationsverarbeitung beim Hören und den dabei auftretenden
Behaltensprozessen. Nachdem die Interpretation dieser Vorgänge im Sinne
eigenständiger sensorischer Register (Neisser: „Ikone“, „Echo“) zugunsten
eines kontinuierlichen Modells (z.B. das Einspeichermodell von Shiffrin
und Schneider) aufgegeben worden ist, findet sich heute wieder zunehmend
Evidenz für eine Zweiteilung. Diese verläuft mitten durch die klassischen
sensorischen Register: Cowan teilt sie in kurze und lange sensorische
Speicher, wobei die kurzen Speicher als ein eigenständiges Phänomen wenig
mit den anderen Gedächtnissystemen gemein haben, während die langen
Speicher eine Variante des Kurzzeitgedächtnisses für sensorische Inhalte
darstellen (siehe Kapitel 1-2).
Während die kurzen sensorischen Speicher schon gut untersucht sind, bedarf
es bei den langen Speichern, in Abgrenzung vom Kurzzeitgedächtnis
einerseits und von den kurzen Speichern andererseits, genauerer
Quantifizierung als Voraussetzung späterer Modellbildung. Dabei bietet sich
im auditiven Fall ein Stimulus besonders an, der als minimal strukturiertes
Signal eine präkategoriale Kodierung erzwingt: weißes Rauschen. In iterierter Form als „periodisches Rauschen“ (PR) dargeboten, dient es als Demonstration für das Echogedächtnis. In der vorliegenden Arbeit wird
zunächst das Phänomen der PR-Wahrnehmung selbst untersucht (Kapitel 3)
und dann dazu benutzt, um mit einer neuen Methodik Lebensdauer und
Kapazität des Echogedächtnisses zu quantifizieren (Kapitel 4-5). In Kapitel
6 werden auf der Basis der Verhaltensdaten Modellvorstellungen für das
Echogedächtnis entwickelt, zwischen denen mittels elektrophysiologischer
Daten entschieden wird. Es werden offene Modellfragen diskutiert und
Anregungen für verwandte Experimente aus dem Bereich der masked priming Paradigmen gegeben. Ein Anhang behandelt technische Fragen der
Signalerzeugung.
Von den seit meiner Promotion behandelten Themen (Signalentdeckungstheorie, adaptive Verfahren in der Psychophysik, Tonhöhenwahrnehmung,
auditive Szenenanalyse, Suchprozesse im Kurzzeitgedächtnis, visueller
Teilbericht, Stereorivalität), die ihren Niederschlag in insgesamt 9
international publizierten bzw. akzeptierten Erstautorpublikationen mit peer-
4
review System gefunden haben, stellt die Forschung zum Echogedächtnis
den in sich abgeschlossensten Zug meiner Forschung dar. Deshalb habe ich
sie für meine Habilitationsschrift ausgewählt. Die dabei vorgestellten
Untersuchungen haben bereits teilweise internationale Publikationen
ergeben. Das Kapitel über die Grundphänomene der Wahrnehmung
periodischen Rauschens (Kapitel 3) baut auf älteren Vorarbeiten auf:
 Kaernbach, C. (1992). On the consistency of tapping to repeated noise, Journal of the
Acoustical Society of America 92, 788-793.
 Kaernbach, C. (1993). Temporal and spectral basis of the features perceived in repeated
noise, Journal of the Acoustical Society of America 94, 91-97.
Die in Kapitel 4 und 5 beschriebenen Untersuchungen zu
kognitionspsychologischen Parametern des Echogedächtnis (Lebensdauer
und Kapazität) sollen ebenfalls publiziert werden:
 Kaernbach, C. (1998). Lifetime and capacity of echoic memory for random wave forms,
eingereicht bei Perception & Psychophysics
Der experimentelle Teil von Kapitel
Echogedächtnisses) ist teilweise publiziert in:
6
(Mechanismen
des
 Kaernbach, C., Schröger, E., Gunter, T.C. (1998). Human event-related brain potentials
to auditory periodic noise stimuli, Neuroscience Letters 242, 17-20
während die hier vorliegende theoretische Aufarbeitung und Modellbildung
bisher nicht publiziert ist.
Ein wesentlicher Grund, in Leipzig Echogedächtnisforschung zu betreiben,
lag darin, daß keine schalldichte Kabine verfügbar war. Experimente mit
Rauschen boten sich an, weil dazu keine Kabine vonnöten ist. Es war mir
ein besonderes Anliegen, während meiner Assistenzzeit für eine gute
Ausrüstung der Abteilung zu sorgen (siehe „Drittmitteleinwerbungen“, Seite
164).
Ich möchte mich bedanken bei Herrn Prof. Dr. Hans-Georg Geißler, ohne
dessen Betreuung diese Arbeit nicht zustande gekommen wäre. Sein Rat war
mir nicht nur für diese Arbeit, sondern auch in allgemeinen Fragen des
beruflichen Werdeganges wichtig und hilfreich. Ich danke Herrn Dr. Laurent
Demany, der mich auf periodisches Rauschen als auditiven Stimulus
aufmerksam gemacht hat. Danken möchte ich den Kollegen am Institut für
Allgemeine Psychologie für ihre Unterstützung, Herrn Dr. Thomas Gunter
und Herrn PD Dr. Axel Mecklinger für ihre Beratung bei der Durchführung
des EEG-Experimentes, Frau Prof. Dr. Angela Friederici für die
Genehmigung
einer
Pilotstudie
am
Max-Planck-Instiut
für
5
Neuropsychologische Forschung, Herrn Dr. Jan Vorbrüggen für die
Diskussion der Methodik des Kapazitätsexperimentes, und den vielen
Studenten, die an den Experimenten mit Engagement und Sorgfalt
mitgewirkt haben.
6
1 Sensorisches Gedächtnis im Kontext moderner Gedächtnistheorien
In seiner vielbeachteten Arbeit zum visuellen Kurzzeitgedächtnis (Sperling,
1960) hat George Sperling nachgewiesen, daß im Fall einer
Teilberichtsinstruktion
nach
der
visuellen
Darbietung
eines
Buchstabenfeldes für eine kurze Zeit (etwa 250 ms) erheblich mehr
Information verfügbar ist, als die vier bis fünf Buchstaben, die
Versuchspersonen typischerweise von diesem Buchstabenfeld noch
wiedergeben können. Diese Untersuchung wurde mehr als ein Jahrzehnt zur
meistzitiertesten Arbeit der experimentellen Psychologie, und es gab viele
Folgeuntersuchungen zu Parametern und Varianten dieses Phänomens sowie
zu verwandten Phänomenen. Zur Popularität dieser Arbeit hat ihre
Interpretation durch Ulric Neisser in seinem Buch Cognitive Psychology
(Neisser, 1967) beigetragen. Neisser interpretierte den Befund als Indiz für
die Existenz eines sensorischen Registers, in dem sämtliche sensorische
Information zwischengespeichert wird. Als eine notwendige Station auf dem
Weg der Informationsverarbeitung vom Wahrnehmungsorgan zum
Bewußtsein war dieses sensorische Register gekennzeichnet durch eine sehr
hohe Kapazität und einen sehr schnellen Zerfall. In dem klassischen
Mehrspeichermodell von Atkinson und Shiffrin (1968) wurde dem
sensorischen Register die Rolle der ersten strukturellen Komponente nach
der Reiztransformation zugewiesen (siehe Abb. 1.1). Die Aufmerksamkeit
sollte als Kontrollprozeß dafür verantwortlich sein, welche Information vom
sensorischen Register in den Kurzzeitspeicher gelangt.
Anfang der achtziger Jahre wurde dieses Konzept zunehmend kritisiert. Ein
einflußreicher Artikel von Ralph Norman Haber (Haber, 1983) war betitelt:
The impending demise of the icon. In diesem Artikel versucht Haber
aufzuzeigen, warum wir einen ikonischen Speicher nicht benötigen, und
weshalb er uns sogar stören würde. Der Artikel erschien bei The Behavioral
and Brain Sciences zusammen mit 31 Kommentaren. Während der größere
Teil der Kommentatoren sich nicht Habers radikaler Sichtweise anschließen
mochte, daß die Ikone keinen Platz in zukünftigen Lehrbüchern haben solle,
wurde durch diese und weitere Literaturbeiträge deutlich, daß die
7
sensorischer Input
sensorische Register
Aufmerksamkeit
Kurzzeitgedächtnis
elaborierendes
Wiederholen
Abruf
Langzeitgedächtnis
Abb. 1.1: Schematische Darstellung des Mehrspeichermodells (nach Atkinson und
Shiffrin, 1968). Die sensorischen Register stellen als eine eigene Einheit eine
obligatorische Durchgangsstation auf dem Weg der Informationsverarbeitung dar.
sensorischen Register nicht mehr als eine einheitliche und obligatorische
Station auf dem Weg der Informationsverarbeitung angesehen wurden.
Sicherlich wird man sich nicht der radikalen Sichtweise Gibsons
anschließen (Gibson, 1966, 1979: „direkte Wahrnehmung“), demnach
keinerlei Verarbeitungsprozesse stattfinden, sondern statt dessen das Gehirn
in „Resonanz“ mit dem Reiz tritt. Doch hat diese provokante These
immerhin soweit auf das Verständnis der Wahrnehmungsvorgänge
eingewirkt, daß heute davon ausgegangen wird, daß im Normalfall die
Information vom Retinabild zu höheren Zentren direkt weiterverarbeitet
wird (unter gegebenenfalls erfolgender Rückkoppelung im Sinne von topdown Prozessen), ohne daß ein eigenes Speichersystem interveniert, von
dem diese Information erst abgerufen werden muß.
Dementsprechend haben spätere Modelle des Gedächtnisses die Bedeutung
der sensorischen Register zurückgenommen. Im Einspeichermodell von
8
Langzeitgedächtnis
Kurzzeitgedächtnis
Ebene 1
automatische Kodierung
Ebene 2 Ebene 3
Ebene n
automatische
Reaktion
kontrollierte Verarbeitung
Aufmerksamkeitssteuerung
kontrollierte
Reaktion
Abb. 1.2: Schematische Darstellung des Einspeichermodells (nach Shiffrin und
Schneider, 1977). Das Kurzzeitgedächtnis ist der aktivierte Teil des
Langzeitgedächtnisses. Die sensorischen Register sind die ersten Verarbeitungsstufen
der automatischen Kodierungskaskade.
Shiffrin und Schneider (1977, siehe Abb. 1.2) wird der Begriff (wie im
übrigen auch der des Kurzzeitspeichers) nicht mehr benötigt. Wenn man in
diesem
Modell
nach
Entsprechungen
zu
den
klassischen
Strukturkomponenten sucht, wird deutlich, daß dem Kurzzeitspeicher der
aktivierte Teil des Langzeitspeichers entspricht, und den sensorischen
Registern wiederum die ersten, sensorischen Ebenen des Kurzzeitspeichers.
Der Begriff des sensorischen Registers ist aber nicht mehr notwendig zur
Erläuterung des Konzepts. Aus einem sensorischen Register wird somit ein
sensorischer Kode, der gegebenenfalls auch erinnert werden kann.
Ein Nachteil des Einspeichermodells ist, daß man mit der Aufgabe fester
Grenzen und der Annahme eines Kontinuums vielen experimentellen
Befunden, die den früheren Strukturkomponenten eindeutig zuordenbar
waren, nicht gerecht wird. Nelson Cowan hat viele Befunde zu den
sensorischen Speichern gesichtet und in neue Strukturen eingeteilt (Cowan
1984, 1988, 1995). Demnach verläuft die eindeutigste Grenze mitten durch
die ehemals einheitlichen sensorischen Register: Cowan findet zwei
9
Hauptklassen mit Zeitkonstanten im Bereich um 200 ms bzw. bei ca. 10
Sekunden. Seine Analyse basiert hauptsächlich auf Daten zu den auditiven
Registern, doch argumentiert er analog für den visuellen Bereich.
Interessante MEG-Befunde bestätigen die Existenz verschiedener
Zeitkonstanten für sensorische Register. Der Ansatz dabei ist, im MEG die
evozierten Potentiale zu repetierten Stimuli in Funktion von der
Repetitionsfrequenz zu messen. Je schneller die Stimuli aufeinander folgen,
desto geringer fallen die Potentiale aus. Dies wird interpretiert als Anzeichen
für eine noch vorhandene Spur. Die Potentiale seien proportional derjenigen
Aktivität, die neu hervorgerufen werden müsse, und das ist weniger, wenn
der Stimulus vor kurzem noch da war und die Spur noch frisch ist. Durch
den Vergleich der so erhobenen Lebensdauern von Spuren im primären
auditiven Kortex mit psychophysisch gemessenen Lebensdauern des
sensorischen Gedächtnisses für die Lautstärke eines Tones bei denselben
Versuchspersonen (Lu et al., 1992) konnte das dahinterstehende Modell
validiert werden. In einer Untersuchung von Uusitalo et al. (1996) wird auf
der Basis dieser Methodik gezeigt, daß es eine Dichotomie von
Zeitkonstanten des Zerfalls sensorischer Spuren mit den Bereichen um 0.10.3 bzw. um 5-10 Sekunden gibt.
Nelson Cowan versucht in seiner Arbeit von 1988 eine Zusammenschau
verschiedener aktueller Modellvorstellungen des Gedächtnisses, die aus
ganz verschiedenen experimentellen Paradigmen hervorgegangen sind und
ganz unterschiedliche Leistungen des Gedächtnisses nachbilden sollen. In
seinem Modell (Abb. 1.3) gibt es eine zentrale Exekutive wie in dem
Arbeitsgedächtnismodell von Baddeley und Hitch (1974), und das
Kurzzeitgedächtnis ist wie beim Einspeichermodell von Shiffrin und
Schneider als aktivierte Form des Langzeitgedächtnisses interpretiert.
Zusätzlich
gibt
es
verschiedene
Mechanismen
zur
Aufmerksamkeitssteuerung, orientiert an dem Filtermodell der
Aufmerksamkeit von Treisman (1960, 1964). Dabei ist aktiviertes
Gedächtnis und Bewußtsein nicht gleichgesetzt (siehe hierzu auch die
Diskussion in Kapitel 6.2 und 6.6). Man erhält somit eine konzentrisch
verschachtelte Struktur von Langzeitgedächtnis, aktiviertem Gedächtnis und
beachteten Aktivationszuständen. Eine Übersicht über die Ableitung seines
Modells gibt Cowan in seinem Buch Attention and Memory: An Integrated
Framework (1995).
10
Zentrale Exekutive
Langzeitgedächtnis
aktiviertes Gedächtnis
(Kurzzeitgedächtnis)
auch langer
sensorischer
Speicher
Reiz
Fokus der
Aufmerksamkeit
kurzer sensorischer
Speicher
Abb. 1.3: Auszüge aus einer schematischen Darstellung des Modells von Cowan
(1988). Der lange sensorische Speicher ist aktiviertes Gedächtnis genau wie das
Kurzzeitgedächtnis. Der kurze sensorische Speicher bildet eine Einheit für sich.
Aktivierte Zustände des Gedächtnisses können (müssen aber nicht) in den Fokus der
Aufmerksamkeit gelangen.
Für die vorliegende Arbeit ist interessant, wie er die beiden sensorischen
Speicher (kurz versus lang) in dieses Modell integriert hat. Für den kurzen
sensorischen Speicher reserviert Cowan eine eigene Komponente außerhalb
des Langzeitgedächtnisses, während der lange Teil wie bei Shiffrin und
Schneider als aktivierte Elemente des Langzeitgedächtnisses gesehen
werden. Man könnte somit auch von einem sensorischen Langzeitgedächtnis
sprechen.
Aus der Sonderposition, die Cowan den kurzen sensorischen Speichern
einräumt, wird deutlich, daß es sich bei diesen Phänomenen um weitgehend
eigenständige Vorgänge handelt, die sich nicht in ein kontinuierliches
11
Modell wie das Einspeichermodell integrieren lassen. Cowan führt als ein
Kennzeichen dieser Stufe an, daß die dort eingeordneten Vorgänge nicht als
Erinnern erfahren werden. Dazu muß angemerkt werden, daß auch
Phänomene des langen sensorischen Speichers (z.B. bei der Wahrnehmung
periodischen Rauschens, siehe die vorliegende Arbeit) oder des Kurzzeit–
oder Langzeitgedächtnisses nicht notwendig als Erinnern erfahren werden.
Dies wird auch deutlich im Zusammenhang mit dem neuerlich viel
Aufmerksamkeit erfahrenden Thema des impliziten Gedächtnisses (z.B.
Roediger, 1990, Tulving und Schacter, 1990). Auch hier wird operational
nachweisbares Gedächtnis nicht als solches erfahren. Glenberg beantwortet
(1997) in seinem Artikel What memory is for die Frage nach dem Sinn des
Gedächtnisses dahingehend, daß es evolutionär gesehen zunächst nur zur
Bereitstellung von Handlungsalternativen benötigt wurde und in dieser
Funktion nicht als Erinnern erfahren wird. Freies Erinnern sei eine späte
Erfindung der Evolution.
Ein anderes Kriterium erscheint geeigneter, die kurzen sensorischen
Speicher von anderen Gedächtnissystemen zu unterscheiden. Es beruht
jedoch auf Vorannahmen über die zugrundeliegenden Repräsentationen.
Diese genügen demnach für bewußt erfahrene versus unbewußt bleibende
Gedächtnisinhalte des Kurzzeitgedächtnisses (bzw. der langen sensorischen
Speicher) gleichen Gesetzmäßigkeiten, wie dies schon Fechner (1860)
vermutet hat. Unter dieser Voraussetzung kann man über die kurzen
sensorischen Speicher sagen, daß die zugrundeliegenden Repräsentationen
auch unter günstigsten Voraussetzungen (stärkere Reizausprägung, längere
Präsentationsdauer, keine Interferenz etc.) nicht durch kognitive Vorgänge
aufrechterhalten werden können. Dies ist für die Repräsentationen im
Kurzzeitgedächtnis und den langen sensorischen Registern hingegen
möglich.
Die vorliegenden Arbeit beschäftigt sich mit dem langen sensorischen
Speicher beim Hören und versucht, ihn möglichst gut gegen kategorial
geprägte Formen des Erinnerns im Kurzzeitgedächtnis abzugrenzen. Dabei
ist es angeraten, mit Stimuli zu arbeiten, bei denen möglichst wenig
Langzeitinformation ausgenutzt werden kann. Daher kommt dasjenige
auditive Stimulusmaterial zum Einsatz, das am wenigsten inhärente Struktur
aufweist und damit am wenigsten Anlaß zur gestaltmäßigen Organisation
gibt: weißes Rauschen. Damit soll versucht werden, einen Beitrag zum
12
Verständnis der präkategorialen Prozesse der Informationsverarbeitung und
-speicherung zu leisten.
13
2 Langer und kurzer auditiver Speicher
Die Existenz des Echogedächtnisses, also des sensorischen Gedächtnisses
beim Hören, wurde 1967 von Neisser im Zusammenhang mit der Definition
der sensorischen Register gefordert. Er führte – anders als bei der Ikone –
keine experimentellen Befunde auf, die diese Annahme stützten, sondern
projizierte die Entdeckung des Echogedächtnisses in die Zukunft. Nelson
Cowan führt in seiner vielbeachteten Übersichtsarbeit zum Echogedächtnis
von 1984 mehr als 160 Referenzen auf, von denen etliche älter sind als
Neissers Buch, und stellt sie in den Zusammenhang des Echogedächtnisses,
ohne daß die damaligen Autoren diesen Begriff gekannt hätten.
Ein Hauptargument, das in der Diskussion um die Ikone aufkam, hat keine
Gültigkeit für das Echogedächtnis. Während in der visuellen Welt gefragt
werden kann, wozu ein sensorisches Register gut sein soll, wenn das
Retinabild immer noch anliegt, man also nur „noch einmal hinzuschauen
braucht“, um an die gewünschte Information zu kommen, ist beim Hören
eindeutig feststellbar, wo der Nutzen eines sensorischen Registers liegen
könnte. Die vom Hörsystem auszuwertende Information kommt als
Informationsfluß in der Zeit an, und bei der Interpretation muß zwangsläufig
auf kurz zuvor verstrichene Information zurückgegriffen werden. Bei der
Sprache steckt z. B. viel Information in den Transienten, den Übergängen,
die erst die Konsonanten definieren. Wenn ein Übergang beurteilt werden
soll, dann muß sowohl klar sein, wohin er führt, als auch, woher er kommt.
Einem sensorischen Register könnte hier die Funktion zugewiesen sein,
zeitlich kurz aufeinander folgende Information zu integrieren.
Cowan teilt die Gedächtnisphänomene, die er dem Echogedächtnis
zuordnet, in zwei Kategorien ein: den kurzen und den langen auditiven
Speicher. Im kurzen auditiven Speicher spielen sich Phänomene ab, deren
Zeitkonstanten unterhalb von typischerweise 200 ms liegen. Diese
Phänomene werden subjektiv nicht als Gedächtnis erfahren, sondern als
Veränderung der Wahrnehmungsqualität, z.B. als Zunahme der Lautheit.
Hierher gehören drei Klassen von Phänomenen: Zunächst die auditive
Persistenz, wobei die Dauer eines Stimulus abgeschätzt werden soll, etwa
durch Synchronisation des Offsets mit einem anderen Stimulus. Unterhalb
von 180 ms Dauer des Zielreizes wird dessen Länge systematisch
14
überschätzt, und zwar so als ob er 180 ms lang wäre (z.B. Efron, 1970).
Ähnlich können Versuche von George von Békésy (Békésy, 1933) eingestuft
werden, bei denen die Steilheit der Offset-Rampe eines 800-Hz Tones
eingestellt werden konnte. Unterhalb von 140 ms konnte keine Steigerung
der Abruptheit des Offsets mehr festgestellt werden. Als zweites wird das
Phänomen der Informationsintegration aufgeführt. Wenn z.B. ein kurzes,
leises Geräusch nahe der Hörschwelle dargeboten wird, dann entscheidet
über die Wahrnehmbarkeit die Gesamtenergie, solange diese über nicht mehr
als 200 ms verteilt ist. Ist sie hingegen über mehr als 200 ms verteilt, dann
wird das Geräusch schlechter hörbar, da Information über längere
Zeitabschnitte nicht mehr so optimal integriert werden kann (z.B. Békésy,
1933). Die dritte Klasse von Phänomenen zum kurzen auditiven Speicher
sind die Vorwärts- und Rückwärtsmaskierung (z.B. Zwislocki, 1972).
Hierbei wird ein leises Signal unhörbar, wenn zuvor (Vorwärtsmaskierung)
oder danach (Rückwärtsmaskierung) ein lauterer Maskierungsreiz gegeben
wurde. Die Vorwärtsmaskierung funktioniert bis ca. 200 ms nach dem
Maskierungsreiz. Die Rückwärtsmaskierung ist deutlich geringer ausgeprägt
und verdeckt lediglich 30-40 ms vor dem Reiz.
Für den langen auditiven Speicher, bei dem das Erinnern in der Regel
subjektiv als solches erfahren wird (siehe hierzu aber die Diskussion in
Kapitel 4.3), führt Cowan vier Klassen von Phänomenen an. Bei den
Suffixeffekten beim Listenlernen wird nach der Liste ein Suffix dargeboten,
das nicht mehr gelernt werden soll. Dieses interferiert bei auditorisch
dargebotenen Listen dennoch mit dem Lernerfolg für die Liste, und zwar
selbst nach 20 Sekunden (z.B. Watkins und Watkins, 1980). In die zweite
Klasse von Phänomenen ordnet Cowan Ergebnisse von Studien mit
dichotischen Beschattungsparadigmen (irrelevant speech) ein. Hierbei wird
beschrieben, daß die Informationen des nichtbeschatteten Kanals nur noch
für ungefähr zwei Sekunden zur Verfügung stehen (z.B. Treisman, 1964).
Als dritte Klasse führt Cowan Teilberichtsstudien analog zum visuellen Fall
an. Hier werden Zeiten bis zu vier Sekunden gemessen. (Es gibt allerdings
in neuerer Zeit methodische Zweifel an diesen Studien.) Das vierte, und für
diese Arbeit interessanteste Phänomen des langen auditiven Speichers ist die
Wahrnehmung von periodischem Rauschen, welche zuerst von Guttman und
Julesz (1963) beschrieben wurde. Guttman und Julesz hatten den Stimulus
entwickelt, um der Frage nachzugehen, bis zu welcher unteren Grenze das
auditive System Periodizitäten analysieren kann. Dabei waren sie von
15
Periodizitäten im 100-Hz Bereich ausgegangen, die einen Tonhöheneindruck
hervorrufen. Etliche Nachfolgepublikationen betitelten das Phänomen denn
auch als „Infra-Tonhöhe“, (infrapitch, z.B. Warren und Bashford, 1981).
Nelson Cowan stellt richtig heraus, daß die bei diesem Stimulus
auftretenden Phänomene auf Gedächtnismechanismen beruhen. Während in
den ersten Arbeiten für die Wahrnehmung periodischen Rauschens
Zeitkonstanten um eine Sekunde berichtet wurden, wurden in späteren
Studien für trainierte Versuchspersonen Zeitkonstanten von 10 Sekunden
beobachtet (z.B. Warren und Bashford, 1981).
Bei den Phänomenen des langen auditiven Speichers findet Cowan eine
Variabilität der gemessenen Zeitkonstanten von ein bis zwei Sekunden am
einen Extrem und bis zu 20 Sekunden am anderen Extrem. Er erklärt diese
Variabilität mit den teilweise nicht vergleichbaren Versuchsbedingungen, die
in unterschiedlichem Maße eine Interferenz mit neuem Stimulusmaterial
erzeugen. Wenn man dies berücksichtige, komme man auf eine Abschätzung
der Lebensdauer des langen auditorischen Speichers von zehn bis zwanzig
Sekunden für den Fall der Nichtinterferenz.
Viele der von Cowan zitierten Arbeiten für den Bereich des langen auditiven
Speichers arbeiten mit sprachlichem Material: bei Teilberichtsstudien,
Beschattungsparadigmen und Listenlernen kamen Worte (oft Zahlworte)
oder Silben zum Einsatz. Das liegt an der einfachen Präsentierbarkeit bzw.
Abfragbarkeit von sprachlichem Material. Hinzu kommt die Möglichkeit
des intermodalen Vergleichs bei visueller Präsentation desselben
sprachlichen Materials. Eine Schwierigkeit bei der Interpretation solcher
Experimente rührt daher, daß der lange sensorische Speicher dem
Kurzzeitgedächtnis für kategoriale Informationen sehr verwandt ist. So
weisen z.B. beide Behaltensvorgänge in etwa dieselbe Lebensdauer auf (z.B.
Murdock, 1961: ca. 10 s für das Kurzzeitgedächtnis). In Cowans
Gedächtnismodell sind sowohl klassisches Kurzzeitgedächtnis als auch die
langen
sensorischen
Speicher
Aktivierungszustände
des
Langzeitgedächtnisses. Es muß daher bei jedem Experiment geklärt werden,
ob es sich bei den beobachteten Gedächtnisphänomenen um kategoriale oder
präkategoriale Formen des Erinnerns handelt.
Dies ist bei den von Cowan angeführten Untersuchungen nicht immer
stringent nachgewiesen. So gilt es etwa als Beweis für die sensorische
Repräsentation eines Stimulus, wenn er zwar durch eine auditive, nicht aber
16
durch eine visuelle Interferenz gestört werden kann. Wenn mal einmal
akzeptiert, daß es zwischen rein präkategorialer und amodal kategorialer
Repräsentation auch Übergänge gibt, so beweist dies lediglich, daß die
Repräsentation nicht vollständig amodal kategorial war. Sie kann sehr wohl
schon auf auditiven Kategorien wie Phonemen etc. basiert sein. Ähnliches
gilt für das Argument, daß beim Beschatten nur dann angegeben werden
kann, ob auf dem nicht beachteten Ohr eine Ziffer gesprochen wurde, wenn
diese auch richtig wiedergegeben werden kann. Auch hier ist eine auditiv
kategoriale Repräsentation nicht nur möglich, sondern sogar wahrscheinlich.
Will man den Unterschied zwischen präkategorialen (Kurzzeitgedächtnis)
und kategorialen (Echogedächtnis) Speicherprozessen möglichst gut
herausarbeiten, dann stellt man am besten schon vom verwendeten Material
her sicher, daß kategoriale Speicherung eine möglichst geringe Rolle spielt.
Unter diesem Gesichtspunkt ist weißes Rauschen ein idealer Stimulus, da
bei diesem Signal keine inhärente Struktur vorliegt, die Anlaß zu
kategorialer Verarbeitung geben könnte (siehe aber die Diskussion in Kapitel
3.1). Von allen von Cowan aufgeführten Experimenten zum langen auditiven
Speicher ist nur bei Experimenten mit periodischem Rauschen sichergestellt,
daß eine weitgehend präkategoriale Repräsentation vorliegt.
Mit dem von Guttman und Julesz eingeführten Stimulus sind schon einige
Experimente durchgeführt worden, aber bei weitem nicht so systematisch
wie mit Sprachmaterial o.ä. Einige qualitative Effekte sind erhoben worden
(siehe Kapitel 3.2). Dringend not tut eine präzise Quantifizierung der bei
periodischem Rauschen zu beobachtenden Gedächtnisphänomene. Dies
geschieht in Kapitel 4 und 5, nachdem zuvor in Kapitel 3 Grundphänomene
der Wahrnehmung von periodischem Rauschen analysiert worden sind. In
Kapitel 6 werden verschiedene Modellvorstellungen zum sensorischen
Gedächtnis verglichen und mit Hilfe elektrophysiologischer Daten zur PRWahrnehmung überprüft. Dabei ergeben sich wegen der engen Beziehung
der langen sensorischen Speicher zum kategorialen Kurzzeitgedächtnis auch
Konsequenzen für Modelle des Kurzzeitgedächtnisses.
17
3 Grundphänomene der Wahrnehmung von
periodischem Rauschen
Dieses Kapitel stellt in den ersten beiden Abschnitten den verwendeten
Stimulus, das weiße und insbesondere das periodische weiße Rauschen vor.
Dabei werden auch klassische Versuche zu diesem Stimulus zitiert (3.2). In
Abschnitt 3.3 wird eine methodische Frage behandelt, ob nämlich Tappen zu
periodischem Rauschen intra– bzw. interindividuell reproduzierbar ist. Diese
Frage war in der bisherigen Literatur nicht behandelt worden, und ihre
Beantwortung stellt eine notwendige Voraussetzung für weitere
Untersuchungen dar, da der Tappzeitpunkt der einzige objektivierbare
Parameter ist, der uns etwas über das Perzept der Versuchsperson sagen
kann. In den folgenden Abschnitten (3.4-3.6) wird versucht, auf der Basis
der erhobenen Tappzeitpunkte die Basismechanismen der Verarbeitung von
periodischem Rauschen näher einzugrenzen. Dies führt schließlich zu einem
ersten Modell der Wahrnehmung periodischen Rauschens (Abschnitt 3.7).
3.1 Rauschen als minimal strukturierter Stimulus
Rauschen ist ein allgegenwärtiges Signal. Um sich das zu verdeutlichen,
braucht man nur den Verstärker seiner HiFi-Anlage ganz aufzudrehen, wenn
kein anderes Signal anliegt: Man wird ein deutliches Rauschen hören. Für
die Signaltechniker ist Rauschen der zu bekämpfende Feind, denn es enthält
keine
Information,
erschwert
aber
das
Verständnis
des
informationstragenden Signals. Daher werden Signalübertragungsanlagen
aller Art (z.B. HiFi-Anlagen) durch den Signal-Rausch-Abstand
gekennzeichnet. Rauschen kommt eben überall vor: selbst bei guten Anlagen
ist es nur einen gewissen (möglichst großen) Abstand leiser als das
erwünschte Signal.
Rauschen ist darüber hinaus das Endprodukt, wenn man möglichst viele
Signale der unterschiedlichsten Art mischt. Dies folgt aus dem sogenannten
„Gesetz der großen Zahl“. Wenn man möglichst viele Sprachaufnahmen
oder Musikaufnahmen zusammenmischt, wird das Signal immer ähnlicher
zu einem Rauschen. Einen Eindruck davon bekommt man, wenn man mit
18
etwas Abstand zu einer sich unterhaltenden Menschenmenge auf das
Gesamtgeräusch achtet.
Rauschen ist ein breitbandiges Signal, enthält also Energie nicht nur in
einigen wenigen Frequenzbändern, sondern kontinuierlich über einen breiten
Bereich. In Analogie zur Optik hat sich eingebürgert, je nach spektraler
Zusammensetzung des Rauschens Farbattribute zu vergeben. Üblich sind die
Bezeichnungen „weißes Rauschen“, „rosa Rauschen“ und „braunes
Rauschen“. Dabei bedeutet „weißes Rauschen“, daß alle Frequenzen im
Hörbereich ungefähr gleich stark vertreten sind. Während eines gewissen
Beobachtungszeitraums können sie wegen der zufälligen Natur des Signals
nicht genau gleich stark auftreten, aber über lange Zeit gemittelt sollte es
keine Unterschiede zwischen den Frequenzbändern geben. Die anderen
beiden Bezeichnungen beziehen sich auf Rauschen mit einem zunehmenden
Übergewicht der tiefen („roten“) Frequenzen. Rosa Rauschen verwendet
man, um auszugleichen, daß die cochleären Frequenzkanäle nicht gleich
breit sind, sondern in der Breite zu den oberen Frequenzen hin zunehmen.
Rosa Rauschen bedenkt alle Frequenzkanäle mit gleich viel Energie. Weißes
Rauschen hingegen erregt die oberen Frequenzkanäle mehr als die unteren.
Dies ist für unsere Untersuchungen kein Nachteil und wird durch die
leichtere Erzeugung und Verarbeitung von weißem Rauschen (Anhang
Anhang A:) aufgehoben.
Wenn man Struktur definiert als inneren Zusammenhang, so folgt, daß
weißes Rauschen maximal unstrukturiert ist. Wie aus Anhang Anhang A:
hervorgeht, kann man es aus einer Folge von Zufallszahlen erzeugen, also
aus Zahlen, zwischen denen kein Zusammenhang besteht. Nun ist der
menschliche Wahrnehmungsapparat darauf ausgelegt, Strukturen zu
erkennen, und das tut er selbst da, wo keine Strukturen sind. Wenn man z.B.
lange genug auf ein Zufallsmuster wie in Abb. 3.1 schaut, werden
unwillkürlich Strukturen sichtbar, die nicht in das Bild hineingelegt worden
sind.
Eine andere Demonstration der Unfähigkeit des menschlichen
Wahrnehmungsapparates, Zufall als solchen zu akzeptieren, gibt Donald E.
Knuth in seinem Buch The Art of Computer Programming (1981) bei der
Frage, wie man Zufallsgeneratoren darauf überprüft, ob sie tatsächlich
(pseudo–) zufällige Zahlenfolgen erzeugen: jedenfalls nicht durch
Inspektion. Als Beispiel führt er die Ziffernfolge der Zahl  an. Diese gilt als
19
Abb. 3.1: Dieses Zufallsmuster entstand, indem für jeden der 256160 Punkte ein
Grauwert zwischen 0 (Schwarz) und 255 (Weiß) gewürfelt wurde. Bei längerer
Betrachtung vermeint man Strukturen wie z.B. Kreise, Tiergesichter, oder
Körperteile zu erkennen.
hochgradig seriell unabhängig: bisher bestand sie alle Tests auf serielle
Abhängigkeiten, denen sie unterworfen wurde. Das hat nicht verhindert, daß
Zahlenmystiker in dieser Folge Strukturen sahen (siehe Abb. 3.2), die sie als
Beleg dafür ansahen, daß diese Zahl etwas Geheimnisvolles zu bedeuten
habe. Sie glaubten, man finde in der Zahl  die Geschichte der Menschheit
in Vergangenheit und Zukunft kodiert, man müsse den Kode nur
entschlüsseln.
3.14159265358979323846264338327950....
Abb. 3.2: Beispiel für vermeintliche Strukturen in der Zahl . Die erste Doppelziffer,
die sich wiederholt, ist die 26 (fett hervorgehoben). Um das zweite Vorkommen der
26 ist eine konzentrische Gruppe von sich wiederholenden Doppelziffern
angeordnet.
Wenn bei der visuellen Wahrnehmung und bei so etwas abstraktem wie der
Zahlenwahrnehmung Strukturen in zufällige Signale hineingesehen werden,
20
dann ist es nicht verwunderlich, daß auch der auditive
Wahrnehmungsapparat versucht, aus einem zufälligen Signal wie weißem
Rauschen Strukturen herauszuhören. Daß ihm das gelingt, wird durch die
Wahrnehmbarkeit der sich wiederholenden Struktur von periodischem
Rauschen bewiesen. Es gelingt ihm allerdings nicht für normales,
nichtrepetitives Rauschen (dieses Phänomen wird in Kapitel 6.1 und 6.2
ausführlicher diskutiert). Wenn es dem Wahrnehmungsapparat erst einmal
gelungen ist, Strukturen zu entdecken, so werden diese Strukturen in
kategorialere Kodes transferiert und auch so memoriert. Der Vorteil von
Rauschen als Stimulus der Echogedächtnisforschung ist, daß der Transfer in
kategoriale Kodes so gering wie eben möglich ist. Jedes andere
Stimulusmaterial weist inhärent mehr Struktur auf und erleichtert daher dem
Wahrnehmungsapparat diesen Transfer. Beim Versuch, mehr über das
sensorische Ende der Verarbeitungskette herauszufinden, ist weißes
Rauschen daher der optimale Stimulus.
3.2 Klassische Versuche mit periodischem Rauschen
Die erste Beschreibung von periodischem Rauschen erfolgte nicht in Zusammenhang mit Forschung zum Echogedächtnis, sondern zur
Tonhöhenwahrnehmung. Guttman und Julesz (1963) haben diesen Stimulus
in einem Kurzbeitrag vorgestellt, als sie auf der Suche nach der unteren
Grenze der Tonhöhenwahrnehmung waren. Tonhöhe hängt normalerweise
nicht vom Vorhandensein des Grundtons ab (missing fundamental). Also
stellten sie sich die Frage, ob Periodizität auch noch für Töne festgestellt
werden kann, deren Grundton außerhalb des Hörbereichs liegt. Dabei muß
man sich überlegen, in welcher Phasenbeziehung die im Hörbereich
liegenden Obertöne zueinander stehen sollen. Spezielle Phasenbeziehungen
wie z.B. die Sinusphase (alle Obertöne haben ihren Nulldurchgang
gleichzeitig mit dem Grundton) erzeugen spezielle Signale (in diesem Fall
eine Klickfolge), für die es trivial ist, daß sie auch noch bei sehr langen
Grundperioden als periodisch erkannt werden können. Um solche
Signalauffälligkeiten zu vermeiden, kann man die Phasenbeziehungen aller
Obertöne zufällig wählen. Das entspricht im Zeitbereich einer zufällig
schwankenden Amplitude. So kann man z.B. für einen Ton mit einer Periode
von zehn Millisekunden (bei einer Digitalisierungsfrequenz von 44.1 kHz
wie bei einem CD-Player) 441 Amplitudenwerte zufällig würfeln. Wenn
21
diese nun zyklisch wiederholt werden, entsteht ein Ton mit einem Grundton
von 100 Hz und Obertönen von n  100 Hz in zufälliger Phasenbeziehung.
Beim Hören erzeugt dieser Ton einen eindeutigen Tonhöheneindruck, der
dem eines 100-Hz Sinustones entspricht. Nun kann man die Periode
verlängern (siehe auch Anhang Anhang A:.A.3), und erhält so einen
gleichmäßigen Übergang bis hin zu weißem Rauschen für die Periodenlänge
„unendlich“. Bei welcher Periodenlänge würde der Tonhöheneindruck
enden?
Das Ergebnis war zugleich enttäuschend und überraschend. Der
Tonhöheneindruck endete unweit der Hörschwelle für den Grundton, bei
Periodenlängen von 50 ms (20 Hz). Die Wahrnehmbarkeit der Periodizität
ging jedoch viel weiter. Erst bei Periodenlängen von 1-2 Sekunden wurde
die rhythmische Struktur nicht mehr gehört. Guttman und Julesz unterteilten
den Bereich der subtonalen Periodizitätsdetektion: Perioden kürzer als ca.
250 ms (schneller als 4 Hz) erzeugten einen Eindruck, der an das Laufen
eines Außenbordmotors erinnerte (motorboating), während bei längeren
Perioden ein rhythmisches Hauchen (whooshing) zu hören ist. Bei
genauerem Hinhören bleibt es nicht dabei: Man erkennt eine Fülle von
kleinen Details wie Klicken, Raspeln oder Summen, die im Rhythmus der
Periode wiederkehren.
Die Wahrnehmung von periodischem Rauschen wurde vielfältig untersucht.
Guttman und Julesz zeigten, daß Hochpaß- oder Tiefpaßfiltern das
Phänomen nicht beeinträchtigten. Warren und Bashford (1981) konnten das
Phänomen auch dann noch nachweisen, wenn der Stimulus auf ein 1/3Oktavband beliebiger Mittenfrequenz beschränkt wurde. Außerdem
untersuchten sie die Wahrnehmung von harmonischen Mischungen von
periodischem Rauschen. Sie bildeten Mischungen, in denen die
Periodenlängen in kleinen ganzzahligen Verhältnissen zueinander standen
(1:2, 2:3, 3:4). In mehr als 65% aller Darbietungen konnten zwei oder mehr
Rhythmen gehört werden. Dabei mußte allerdings das Verhältnis ganz genau
eingehalten werden. Wenn sie z.B. zwei Rauschen mit fast gleicher
Periodenlänge mischten, wurde der Periodizitätseindruck durch einen
Unterschied der Perioden von nur 1/1000 zerstört. Im Unterschied zu
Guttman und Julesz konnte ihre beste Versuchsperson auch noch Perioden
bis zu zehn Sekunden Länge detektieren. Warren und Wrightson (1981),
Warren (1982), und Patterson, Milroy und Lutfi (1983) untersuchten den
22
Einfluß der Phase auf die Wahrnehmung von periodischem Rauschen. So
wurde z.B. in aufeinander folgenden Zyklen die Rauschprobe invertiert (mit
-1 multipliziert, d.h. um 180° gedreht) oder um andere Winkel (z.B. 90°)
gedreht. Das änderte in dem für die vorliegende Arbeit relevanten Bereich
von Periodenlängen jenseits der Tonhöhenempfindung nichts an der
Wahrnehmung der Periodizität. Warren, Wrightson und Puretz (1988)
fanden eine Kontinuitätsillusion für periodisches Rauschen, d.h. der
Stimulus wurde für eine kurze Zeit als periodisch empfunden, nachdem die
Periodizität abgestellt worden war. Limbert (1984) konnte nachweisen, daß
die Periodizität auch dann noch hörbar ist, wenn zugleich ein lauteres
maskierendes kontinuierliches Rauschen gegeben wird. Pollack (1990)
untersuchte Unterschiedsschwellen für periodisches Rauschen in der
Gegenwart von maskierendem kontinuierlichem Rauschen im Bereich von
0.1 bis 10000 Hz.
Während viele Studien den Aspekt der Periodizitätsanalyse in den
Vordergrund stellen (bis hin zur Verwendung des Begriffs infrapitch), stellt
Nelson Cowan (1984) dieses Experiment richtig in den Zusammenhang von
Gedächtnisexperimenten. Eine kleine informelle Beobachtung möge dies
verdeutlichen: Wenn die Periodenlänge zufällig variiert wird, in dem ein
wechselnd langes Teil am Ende der Rauschprobe weggelassen wird, dann ist
die Periodizität zwar massiv gestört, der Wahrnehmungseindruck ändert sich
jedoch nicht wesentlich. Man hört immer noch eine sich wiederholende
Struktur, die jetzt keine genaue Periodizität mehr einhält, aber dadurch an
Deutlichkeit nichts verliert. Für einen Mechanismus zur Periodizitätsanalyse
ist das nicht verständlich, während ein Gedächtnismechanismus dies
plausibel erklären kann, da er nicht darauf angewiesen ist, daß das Erinnerte
in einem bestimmten Rhythmus wiederkehrt.
Limbert (1984) konnte nachweisen, daß nur zwei Wiederholungen benötigt
werden, um eine spezielle Rauschprobe zu erlernen, und daß die Spur
innerhalb einiger Sekunden zerfällt. Bashford und Warren (1990)
untersuchten das Wiedererkennen erlernter Segmente von periodischem in
Breibandrauschen eingebetteten Bandpaßrauschen. Brubaker und Warren
(1990) fanden, daß ein einmal erlerntes Segment wiedererkannt werden
kann, wenn es in einem längeren Stück gefrorenen Rauschen eingebettet ist.
Auch einige Studien zu anderen repetierenden Stimuli (außer weißem
Rauschen) sind in diesem Zusammenhang relevant. Preusser et al. (1970)
23
und Preusser (1972) untersuchten, wie repetierte auditive Muster organisiert
werden, wo z.B. der Startzeitpunkt gehört wird (siehe Abschnitt 3.4).
Schubert und West (1969) verwendeten moduliertes weißes Rauschen und
bestimmten die Anzahl der Wiederholungen, die nötig war, um sich
wiederholende Muster von sich nicht wiederholenden Mustern zu
unterscheiden. Pollack (1972, 1975) zeigte, daß das Gedächtnis für
Zufallsklickfolgen innerhalb einiger Sekunden zerfällt und anfällig ist gegen
Interferenz im Retentionsintervall. Zyklische Muster hoher und tiefer Töne
können unterschieden werden, aber die Ordnung der Elemente kann nicht
angegeben werden (Broadbent und Ladefoged, 1959; Warren und Obusek,
1972; Warren und Ackroff, 1976). Die Bildung perzeptueller „Ströme“
(streams) hängt von der Periodenlänge, Ähnlichkeit, und anderen
Gestaltprinzipien ab (einen Überblick bietet Bregman, 1990).
3.3 Experiment 1: Reproduzierbarkeit des Mittappens
Wenn man periodisches Rauschen hört, ist es eine ganz natürliche Reaktion,
daß man den Rhythmus der gehörten Struktur durch rhythmische
Bewegungen, z.B. durch Mittappen des Rhythmus anzeigt. Auf diese Weise
läßt sich schnell und informell überprüfen, ob zwei Personen das Gleiche in
diesem Rauschen hören: dann würden sie im gleichen Rhythmus tappen.
Außerdem handelt es sich um eine von den Versuchspersonen als leicht
empfundene Tätigkeit. Der Tappzeitpunkt ist ein Indikator für das subjektive
Perzept der Versuchsperson, der einfach zu erheben und gut mathematisch
zu behandeln ist (z.B. Korrelation o.ä.).
Andere Versuche, die Perzepte zu objektivieren, schlagen regelmäßig fehl.
So kann man den Versuchspersonen z.B. die Möglichkeit der freien,
verbalen Beschreibung der von ihnen gehörten Struktur geben, oder sie
Frequenzverläufe und Rauhigkeiten graphisch darstellen lassen. Man wird
dabei auf eine derartige Fülle von verschiedenen Arten, ein und dasselbe
darzustellen, stoßen, daß der Versuch des Vergleichs zwischen
Versuchspersonen sich als aussichtslos erweist. Wenn man andererseits
versucht, durch vorgegebene Kategorien diese Vielzahl einzuschränken,
wird man wiederum nicht der Fülle der möglichen Perzepte gerecht. Am
ehesten können sich zwei Versuchspersonen noch durch den Versuch der
lautlichen Imitation darüber verständigen, ob sie dasselbe hören, aber diese
Methode entzieht sich einer exakten wissenschaftlichen Quantifizierbarkeit.
24
Limbert und Patterson (1982, Limbert 1984) haben gezeigt, daß man zu
periodischem Rauschen während einer Darbietung zuverlässig zu ein und
derselben Phase tappt. Dazu boten sie ihren Versuchspersonen sehr lange
Darbietungen periodischen Rauschens (über 100 Zyklen) und erhoben die
Konsistenz des Tappens in einer solchen Darbietung. Es zeigte sich, daß die
Versuchspersonen überwiegend ganz konsistent zu ein und derselben Phase
des Zyklus tappen konnten. Da aus der Rhythmusforschung bekannt ist, daß
ein einmal vorgegebener Rhythmus nicht sehr konstant weiterproduziert
werden kann, ist schon nach wenigen Zyklen überprüfbar, ob die Periodizität
entdeckt worden ist oder nicht. Im folgenden werden in der Regel acht
Zyklen als ausreichend gewertet. Auf diese Weise wird eine höhere Zahl
getrennter Darbietungen erzielt als bei Limbert (1984). Deren Statistik war
nicht ausreichend, um die Frage zu beantworten, ob Versuchspersonen in
verschiedenen Darbietungen desselben Rauschens denselben Tappzeitpunkt
wählen.
Es ist ein wichtiges Anliegen, die Verwendbarkeit des erhobenen Tappzeitpunktes für die Objektivierbarkeit der Perzepte systematisch zu untersuchen.
Zumindest eine gewisse Korrelation der Tappzeitpunkte in verschiedenen
Präsentationen desselben periodischen Rauschens (z.B. an verschiedenen
Tagen) ist Voraussetzung dafür, daß mittels kleiner Variationen des Stimulus
untersucht werden kann, inwieweit diese Manipulationen einen Einfluß auf
die Perzeption des periodischen Rauschens haben. Wenn man darüber
hinaus allgemeine Gesetzmäßigkeiten über die zugrundeliegenden
Strukturbildungsprozesse ableiten will, müßte eine gewisse Korrelation der
Tappzeitpunkte zwischen Versuchspersonen gegeben sein. Diese könnte
allerdings vom kulturellen Hintergrund (siehe hierzu die Diskussion in
Abschnitt F) und/oder vom Geschlecht der Versuchspersonen abhängen.
Somit kommen wir zu folgenden drei aufeinander aufbauenden
HYPOTHESEN:
1.) Die hörbar werdenden Perzepte beruhen auf Gesetzmäßigkeiten der Strukturbildung, die
für eine bestimmte Versuchsperson konstant in der Zeit sind. Wenn dieselbe
Versuchsperson in verschiedenen Darbietungen dasselbe periodische Rauschen geboten
bekommt, müßten daher die in diesen verschiedenen Darbietungen erhobenen
Tappzeitpunkte zu einem gewissen Grade miteinander korreliert sein.
2.) Die Gesetzmäßigkeiten der Strukturbildung sind für verschiedene Versuchspersonen
ähnlich. Wenn für zwei Versuchspersonen ein Profil der möglichen Tappzeitpunkte für
25
eine bestimmte Rauschprobe erhoben wird, sollten die Profile dieser beiden
Versuchspersonen miteinander korreliert sein.
3.) Die individuellen Ausprägungen der Strukturbildung sind teilweise angeboren bzw.
Ergebnis biologischer Reifungsprozesse, teilweise gelernt. Daher könnte ein
unterschiedlicher kultureller Hintergrund (z.B. verschiedene Muttersprache) bzw. eine
andere genetische Ausstattung (z.B. Geschlecht) zu meßbaren Unterschieden in diesen
Ausprägungen führen. Empirisch sollten die Korrelationen zwischen Versuchspersonen
mit gleicher Muttersprache bzw. gleichem Geschlecht meßbar höher ausfallen.
I. Methodik
A. Versuchspersonen
Um einen Vergleich des kulturellen Einflusses verschiedener
Muttersprachen zu ermöglichen, wurden die Versuchspersonen im Alter von
24 bis 40 Jahren aus drei verschiedenen Herkunftsländern ausgewählt (D:
Deutschland, F: Frankreich und C: China, genauer: Peking, mit gleichem
Dialekt). Jede Nationalitätengruppe bestand aus zwei männlichen (Index 1
und 2) und einer weiblichen (Index 3) Versuchsperson. Versuchsperson D1,
F1 und F2 hatten schon an psychoakustischen Experimenten teilgenommen.
Zum Zeitpunkt des Experiments lebten alle Versuchspersonen seit
mindestens einem Jahr in Frankreich und waren des Französischen (und im
übrigen auch des Englischen) mächtig.
B. Stimuli
Das periodische Rauschen wurde mit cosinusoidalen Rampen ein- bzw.
ausgeschaltet. Die Rauschproben wurden digital erzeugt wie im Anhang A
beschrieben. Sie wurden von 16-bit Konvertern mit 20 kHz gewandelt. Die
Standardabweichung des Gaußschen Rauschen war 10% des
Konvertierbereichs, die spektrale Energiedichte war 24 dB SPL pro Hz. Die
verwendeten Rauschproben können mit dem in Anhang A beschriebenen
Zufallsgenerator in nachfolgenden Studien exakt reproduziert werden. Neun
verschiedene Rauschproben wurden erzeugt (PR1-PR9), und zwar mit den
Indizes 1-9 des Algorithmus. Die Zykluslänge war 500 ms für PR1-PR3, 600
ms für PR4-PR6, und 700 ms für PR7-PR8. Das heißt, für PR1 wurden die
ersten 10000 Punkte (= 500 ms) der mit Index 1 erzeugten
Zufallszahlenfolge immer wieder aneinandergehängt und diese Zahlenfolge
konvertiert. Es ist offensichtlich, daß bei diesem Vorgehen die
„Schnittstelle“ (der Anfang der Zufallszahlenfolge) kein hörbares Artefakt
26
produziert, da die Zufallszahlen seriell unabhängig sind. Ein zufälliger
Anteil des ersten Zyklus wurde weggelassen, so daß zwei verschiedene
Darbietungen desselben Stimulus (z.B. PR1) nicht mit demselben Startpunkt
anfingen.
C. Verfahren
Die Versuchspersonen saßen in einer schalldichten Kammer und hörten das
periodische Rauschen über Sennheiser 2002 Kopfhörer. Sie wurden
instruiert, dem Stimulus zunächst einige Sekunden zuzuhören ohne
mitzutappen. Dann sollten sie im Rhythmus mit der gehörten Periodizität
mittappen, und zwar einmal pro Periode. Wenn sie mehrere Ereignisse pro
Periode hörten, sollten sie zu demjenigen Ereignis tappen, das sie als
besonders betont empfinden. Wenn einmal zwei Ereignisse nahezu
gleichgewichtig empfunden wurden, sollten sie zu demjenigen Ereignis
tappen, das besser zeitlich definiert war (also eher das Klicken als das
Raspeln). Neun verschiedene Stimuli wurden in Zufallsordnung angeboten,
unter Vermeidung einer direkten Wiederholung ein und desselben Stimulus.
Die Darbietung eines Stimulus (Einzelversuch) startete automatisch zwei
Sekunden nach der vorhergehenden und endete, wenn die Versuchsperson
achtmal getappt hatte. Obwohl Pilotuntersuchungen gezeigt hatten, daß es
keinen Unterschied macht, ob die Einzelversuche am selben Tag oder nach
zwei Monaten erfolgten, wurde ein fester Versuchsplan eingehalten, bei dem
300 Einzelversuche in drei Sitzungen zu je 100 Einzelversuchen an drei
verschiedenen Tagen innerhalb einer Woche stattfanden.
II. Ergebnisse
A. Histogramme der Tappzeitpunkte
In jedem Einzelversuch wurden n = 8 Tappzeitpunkte ti bestimmt. Sie
wurden als n komplexe Einheitsvektoren vi = exp(2iti/) aufgefaßt. Dabei
ist  die Länge des Rauschzyklus (500, 600 oder 700 ms) in diesem
Einzelversuch. Aus der Phase  des Summenvektors V = vi errechnet sich
der mittlere Tappzeitpunkt <t>:  = 2<t>/. Die Länge L = ||V|| des
Summenvektors ist maximal (L=n) bei Tappen perfekt im Rhythmus der
Periodizität, und von der Größenordnung n bei zufälligem Tappen. Für fast
perfektes Tappen (2ti/ =   , mit kleinem ) ergibt sich für L
27
Gl. 3.1:
L = n  cos()  n  (1  ²/2),

  (2  2L/n)½.
Das Ausschlußkriterium für einen Einzelversuch war   0.2  . Das war
relativ selten der Fall (6%), d.h. in 94% der Einzelversuche konnte der
mittlere Tappzeitpunkt zuverlässig aus den Daten bestimmt werden. Abb.
3.3 zeigt Histogramme für jede Versuchsperson und Rauschprobe. Die
Abszisse zeigt die Tappzeitpunkte <t> (Binweite 25 ms), und die Ordinate
die Häufigkeit, mit der dieser Tappzeitpunkt gewählt wurde.
Man erkennt, daß in der Regel im Sinne von Hypothese 1 ein bis zwei
bevorzugte Tappzeitpunkte je Rauschprobe gewählt wurden. Dabei ist die
zyklische Natur der Abszisse zu beachten: liegen wie bei <PR2,C2> zwei
Häufungen an den Enden der Abszisse, dann beziehen sie sich doch auf nur
einen Tappzeitpunkt. Vergleicht man die Histogramme für eine bestimmte
Rauschprobe zwischen den Versuchspersonen, dann zeigt sich oft eine
bemerkenswerte, allerdings nicht perfekte Korrelation. Die folgenden
Abschnitte leiten Korrelationsmaße ab, die dies genauer quantifizieren
sollen.
B. Varianzbrüche
Sei kj (j=1,...,m) die Anzahl der Einträge in eines der m Bins eines
bestimmten Histogramms (m=20, 24, oder 28). Der Erwartungswert E(k) =
kj/m ist gleich K/m, wobei K = kj die Gesamtzahl aller Einträge in dieses
Histogramm ist. Die Wahrscheinlichkeitsdichte pj sei (über Bins der Weite
1/m) definiert als
Gl. 3.2:
pj = kj  m / K.
Der Erwartungswert E(p) ist gleich eins. Die Varianz Vp ist
Gl. 3.3:
Vp = E(p²)  E²(p) = E(p²)  1.
Zufallstappen würde eine durchschnittliche Varianz von Vpr  m/K erzeugen.
Wenn es im Histogramm jedoch eine Häufung von Tappzeitpunkten gibt, ist
die gemessene Varianz Vp größer. Das Verhältnis Vp/Vpr von beobachteter zu
zufälliger Varianz ist ein Maß dafür, inwieweit die Versuchsperson (VP) für
diese Rauschprobe ihr Tappen in verschiedenen Darbietungen auf einige
wenige Bins konzentrieren konnte. In Tab. 3.1 ist in der zweiten Zeile für
28
jede VP das über alle neun Rauschproben gemittelte Varianzverhältnis
wiedergegeben. Daraus geht hervor, daß es für alle Versuchspersonen
deutliche Häufungen der Tappzeitpunkte im Histogramm entsprechend
Hypothese 1 gibt. Insbesondere die Versuchspersonen D1, F2 und C1 zeigen
eine hohe Konzentration ihrer Tappzeitpunkte auf wenige Bins.
PR1 PR2 PR3 PR4 PR5 PR6 PR7 PR8 PR9
500 ms
600 ms
700 ms
D1
D2
D3
F1
F2
F3
C1
C2
C3
Abb. 3.3: Histogramme der Tappzeitpunkte in Experiment 1. Die Histogramme
zeigen die Häufigkeit (Ordinate) eines bestimmten Tappzeitpunktes (Abszisse,
eingeteilt in Bins zu je 25 ms).
29
VP D1
D2
D3
F1
F2
F3
C1
C2
C3
Mittel
Vp / Vpr 8.1
2.4
4.7
4.1
7.5
3.7
7.7
4.4
3.6
5.1 ± 2
Vx /
Vxr
18.2 5.2 10.5 11.9 15.1 10.4 17.5 8.8
8.2 11.8 ± 4.1
Tab. 3.1: Mittlere Varianzbrüche je Versuchsperson. In der zweiten Zeile sind die
gewichteten Varianzbrüche dargestellt, siehe Abschnitt D.
C. Autokorrelation
Sei pjt die um t Bins rotierte Wahrscheinlichkeitsdichte eines Histogramms.
Die Autokovarianz Vpp(t) und der Autokorrelationskoeffizient a(t) sind dann
Gl. 3.4:
Vpp(t) = E(ppt)  1,
a(t) = Vpp(t) / (VpVpt)½ = Vpp(t) / Vp.
Die Autokorrelation ist im Mittel über alle Bins gleich Null. Abb. 3.4 zeigt
die Autokorrelation gemittelt über alle Rauschproben gleicher Länge als
Funktion der Verschiebung t. Die drei Teilbilder entsprechen den
verschiedenen Längen der Rauschproben (500, 600 bzw. 700 ms). Die
schraffierten Histogrammbalken entsprechen dem Mittel über alle
Versuchspersonen, die fett gezeichneten Histogrammbalken den
Mittelwerten nur für die besten drei Versuchspersonen (D1, F2, C1). Ganz
offensichtlich sind eng benachbarte Bins gut korreliert, wie der Gipfel bei
Null zeigt. Auch dies ist eine Bestätigung von Hypothese 1. Die Breite
dieses Gipfels entspricht der Genauigkeit, mit der dieser Tappzeitpunkt in
einer späteren Darbietung wiedergefunden werden konnte. Ein Bin
entspricht 25 ms.
Die Autokorrelationsfunktionen für die drei besten Versuchspersonen fallen
etwas schneller gegen Null. Außerdem erkennt man hier einen Nebeneffekt
etwas deutlicher: Wenn die Versuchsperson nicht den bevorzugten
Tappzeitpunkt reproduziert, dann hat sie eine leicht erhöhte
Wahrscheinlichkeit, genau in Gegenphase zu tappen. Limbert (1984) hatte
dies schon vermutet, konnte es aber auf Grund der geringen Statistik seiner
Untersuchung nicht nachweisen. Dies wird besonders für 700 ms deutlich.
Abb. 3.5 zeigt einen Fit einer Funktion aus zwei Gaußschen
Normalverteilungen mit Schwerpunkt bei 0 und  0.5 (Zykluslänge = 1).
Dabei macht die Höhe des Nebengipfels bei 0.5 bereits 11% der Höhe des
Hauptgipfels bei 0 aus. Die Standardabweichung ist mit 0.05 für den
Hauptgipfel recht schmal, was die hohe Reproduzierbarkeit des
30
Tappzeitpunktes in einer späteren Darbietung widerspiegelt. Dies gilt auch
für den Nebengipfel (Standardabweichung 0.06), so daß es sich bei diesem
Nebengipfel wohl nicht ein Artefakt, bedingt durch die den Hauptgipfel
begleitenden Täler, sondern um ein eigenständiges Phänomen handelt. Eine
mögliche Interpretation ist, daß ein stark ausgeprägtes Detail der
Wellenform, das ein gut hörbares Perzept auslöst, durch eine Art
„rhythmischer Verstärkung“ andere Details der Wellenform ins Blickfeld
bringt, die genau eine halbe Zykluslänge von ihnen entfernt sind.
1
0.5
Alle
Beste
0
-0.5
1
0.5
Alle
Beste
0
-0.5
1
0.5
Alle
Beste
0
-0.5
Abb. 3.4: Autokorrelation der Bins in den Histogrammen der Tappzeitpunkte (Abb.
3.3), getrennt für die verschiedenen Längen der Rauschzyklen (500, 600 bzw. 700
ms), über alle (schraffiert) bzw. nur die drei besten Versuchspersonen (fett) gemittelt.
31
1
0.5
0
-0.5
0
0.5
-0.5
Abb. 3.5: Fit einer Funktion aus zwei Normalverteilungen an das
Autokorrelationshistogramm für die besten drei Versuchspersonen für 700 ms,
aufgetragen über der relativen Zykluslänge. Man erkennt deutlich den zweigeteilten
Nebengipfel bei 0.5 Zykluslängen.
D. Gewichtete Korrelation
Die in der zweiten Zeile von Tab. 3.1 aufgelisteten Varianzbrüche haben
bisher Nachbarschaftsbeziehungen zwischen den Bins nicht berücksichtigt:
es spielte keine Rolle, ob zwei Tappzeitpunkte in die Histogrammbins 8 und
9 oder 8 und 17 eingingen. Im folgenden soll eine gewichtete
Varianzberechnung durchgeführt werden, bei der benachbarte bins
miteinander verbunden werden. Die gewichtete Wahrscheinlichkeitsdichte xJ
sei
Gl. 3.5:
xj = d=3...3 wd  (kj+d  m/K),
wobei d=3...3 wd = 1.
Dabei ist d der Abstand zwischen zwei bins, und wd der Gewichtsfaktor, der
zwei Histogrammeinträge im Abstand d verbinden soll. Der Erwartungswert
E(x) ist wiederum gleich eins. Die im folgenden verwendeten Gewichte sind
0.25, 0.20, 0.125 und 0.05 für ||k|| = 0,1,2,3 (siehe auch Abb. 3.6). Sie
wurden entsprechend dem Hauptgipfel der Autokorrelationsfunktionen
(Abb. 3.4) gewählt. Anders ausgedrückt, handelt es sich bei den xj um eine
verschmierte Version der originalen Schätzer pj. Sie ist bereinigt von
kurzreichweitigen zufälligen Fluktuationen. Dadurch kann man Strukturen
in den Histogrammen besser analysieren, die die Größe dieser
Gewichtsfunktion haben oder größer sind. Kleinere Strukturen sollten auch
gar nicht meßbar sein, da sie durch die Tappungenauigkeit verdeckt werden
müßten. Die Varianz Vx für die verschmierte Wahrscheinlichkeitsdichte ist
32
Gl. 3.6:
Vx = E(x²)  1.
0.3
Für
diese
verschmierten
Wahrscheinlichkeitswerte xj ist die für eine
zufällige Verteilung der Tappzeitpunkte zu 0.2
erwartende Varianz erheblich kleiner als für
die originalen pj, da viele der zufälligen
Fluktuationen geglättet werden. Die 0.1
tatsächlichen Tappzeitpunktshistogramme
jedoch zeigen Strukturen, die nicht
0
geglättet werden, da sie die Breite der
-5 -4 -3 -2 -1 0 1 2 3 4 5
Glättungsfunktion haben. Berechnet man
daher die Varianzbrüche von Tab. 3.1 mit Abb. 3.6: Die Gewichte, die bei der
Berechnung
der
gewichteten
diesen
gewichteten Korrelationen Anwendung fanden.
Wahrscheinlichkeitsdichten, ergeben sich
weitaus höhere Varianzbrüche (dritte Zeile von Tab. 3.1). Dies wäre bei
Zufallstappen nicht zu erwarten und bestätigt daher erneut Hypothese 1. Da
die Entfernung der zufälligen Fluktuationen durchaus im Sinne dieser
Datenanalyse
ist,
werden
im
folgenden
die
gewichteten
Wahrscheinlichkeitsdichten verwendet.
In Tab. 3.1 wurden die Varianzbrüche über die Rauschproben gemittelt, so
daß die unterschiedliche Tappräzision der Versuchspersonen deutlich wurde.
In Tab. 3.2 wurden die gewichteten Varianzbrüche über Versuchspersonen
gemittelt. So wird für jede Rauschprobe die „Eindeutigkeit“ ermittelt, mit
der diese Rauschprobe (jeweils in einer bestimmten Versuchsperson) immer
ein und denselben Tappzeitpunkt auslöst. Die Standardabweichung der
Werte in Tab. 3.2 ist 1.9, in der entsprechenden Zeile von Tab. 3.1 ist sie 4.1;
daraus wird deutlich, daß die Reproduzierleistung der Versuchspersonen
erheblich mehr variiert als die Eindeutigkeit der Rauschproben. Die
Leistung der Versuchspersonen könnte durch Training bzw. durch
Vorauswahl (nach Musikalität, oder auf Grund eines kurzen Tests) deutlich
gesteigert werden.
Stimulus PR1 PR2 PR3 PR4 PR5 PR6 PR7 PR8 PR9
Mittel
Vx / Vxr 10.6 12.9 13.5 10.2 10.8 13.7 8.1 14.4 11.6 11.8 ± 1.9
33
Tab. 3.2: Gewichtete Varianzbrüche gemittelt über Versuchspersonen. Diese Werte
streuen weniger als die über die Rauschproben gemittelten gewichteten
Varianzbrüche: die Rauschproben sind weniger unterschiedlich als die
Versuchspersonen.
E. Korrelationen zwischen Versuchspersonen
Sei yj die gewichtete Wahrscheinlichkeitsdichte eines zweiten Histogramms.
Die Kovarianz Vxy und der Korrelationskoeffizient sind dann
Gl. 3.7:
Vxy = E(xy)  1,
r = Vxy / (VxVy)½.
Rhythmisches Tappen erfolgt in dem in Frage kommenden Frequenzbereich
(hier ca. 2 Hz) im allgemeinen antizipatorisch zu den wahrgenommenen
Ereignissen. Wenn man z.B. einen eindeutig definierten Stimulus wie eine
rhythmische Klickfolge abspielt, dann wird rhythmisches Mittappen ca. 30
ms vor dem Klick erfolgen. Dies liegt an dem Versuch der Versuchsperson,
die beiden Perzepte zu synchronisieren. Da aber die Übertragung der taktilen
Wahrnehmung deutlich länger braucht als die der auditiven Wahrnehmung,
tappt die Versuchsperson etwas zu früh. Der genaue Betrag der Antizipation
ist von Versuchsperson zu Versuchsperson unterschiedlich (einen Überblick
gibt Schmidt, 1968). In den Daten von Experiment 1 (Abb. 3.3) sehen wir
diesen Effekt am deutlichsten beim Vergleich von F1 und F2. Diese beiden
zeigen eine gute Übereinstimmung ihrer Tappzeitpunkte. Dabei tappt F2
allerdings immer etwas später als F1. Um vor einem Vergleich der
Versuchspersonen einen Ausgleich solcher Unterschiede zu ermöglichen,
wurden je Versuchsperson kleine Verschiebungen der Histogramme um ein
oder höchstens zwei Bins zugelassen. Diese Verschiebungen (Shifts) wurden
dann auf alle Histogramme dieser Versuchsperson angewandt. Der Betrag
dieser Verschiebung ist in der zweiten Zeile von Tab. 3.3 wiedergegeben. Er
wurde so gewählt, daß die Gesamtkorrelation maximal wurde. Die
Korrelationen zwischen verschiedenen Versuchspersonen nach Gewichtung
(siehe oben, Abschnitt D) und Korrektur auf Antizipationszeitdifferenzen
sind in der Matrix von Tab. 3.3 wiedergegeben.
VP
D1
D2
D3
F1
F2
F3
C1
C2
C3
Shift (Bins)
1
0
0
2
-1
1
0
-1
2
34
D2
.36
D3
.56
.26
F1
.38
.25
.47
F2
.37
.43
.47
.63
F3
.50
.44
.38
.49
.60
C1
.53
.32
.43
.20
.26
.29
C2
.30
.69
.41
.33
.53
.50
.40
C3
.60
.40
.59
.51
.37
.40
.49
.37
Tab. 3.3: Korrelationen zwischen Versuchspersonen nach Wichtung der
Wahrscheinlichkeitsdichten
(Abschnitt
D)
und
Korrektur
der
Antizipationszeitdifferenzen (2. Zeile). Die durchschnittliche Korrelation beträgt
0.43.
Wie aus der Matrix von Tab. 3.3 hervorgeht, gibt es ganz im Sinne von
Hypothese 2 beachtliche Korrelationen zwischen verschiedenen
Versuchspersonen. Jeder dieser Korrelationskoeffizienten geht aus 216
Wertepaaren entsprechend der Zahl der Histogrammbalken pro
Versuchsperson hervor. Wenn man berücksichtigt, daß diese nicht
unabhängig voneinander sind, kommt man bei der beobachteten Breite der
Autokorrelationsfunktion auf ca. 100 unabhängige Werte. Für n=100 ist eine
positiv zu erwartende Korrelation signifikant größer als Null auf einem 5%Niveau (einseitiger Test) ab r>0.1645. Somit ist selbst der kleinste
Korrelationswert aus Tab. 3.3 (0.2 zwischen C1 und F1) eindeutig
signifikant. Als zusätzlicher Test wurden dieselben Daten randomisiert
korreliert (nach Vertauschen und Rotieren der Rauschproben). Dabei
ergaben sich in Übereinstimmung mit obiger Abschätzung Werte zwischen
-0.1 und 0.1.
F. Einfluß von Muttersprache und Geschlecht
Es ist bekannt, daß sich die sensorischen Systeme in Abhängigkeit von der
Exposition mit Reizen entwickeln. So können z.B. junge Katzen, die in
einer künstlichen Welt mit ausschließlich vertikalen Linien aufgewachsen
sind, später horizontalen Linien nur erschwert erkennen. Für den auditiven
Bereich bietet besonders das sprachliche Material, mit dem wir konfrontiert
35
werden, eine Quelle für mögliche Unterschiede. Unser Wissen um
Sprachproduktion
leitet
z.B.
unsere
Wahrnehmung
des
Betonungszeitpunktes bei Sprachmaterial: Fowler (1979) und Marcus
(1981) ließen ihre Versuchspersonen die einzelnen Abstände zwischen
gesprochenen Ziffern so einstellen, daß diese die Ziffernfolge als
gleichabständig empfanden. Dabei traten systematische Unterschiede zur
physikalischen Gleichabständigkeit auf, die durch das Wissen der
Versuchspersonen um Sprachproduktion (angenommene artikulatorische
Bewegungen zur Erzeugung des Wortes) erklärbar sind. Somit könnte der
verschiedene kulturelle Hintergrund der Versuchspersonen zu Unterschieden
in der Wahrnehmung von periodischem Rauschen führen. Auch Cutler et al.
(1983; Cutler, 1991) konnten Unterschiede bei der Entdeckung und
Erkennung komplexer Schalleigenschaften sowie bei deren gestaltmäßiger
Organisation finden. Die Auswahl der Versuchspersonen aus
unterschiedlichen Ländern sollte einen Vergleich zwischen der
Wahrnehmung von periodischem Rauschen bei verschiedenen
Muttersprachen ermöglichen.
Der Durchschnitt aller Korrelationskoeffizienten in Tab. 3.3 ist 0.43. Die
Korrelation zwischen Versuchspersonen mit der selben Muttersprache ist
geringfügig höher (0.463) als die Durchschnittskorrelation, aber dieser
Effekt ist nicht signifikant. Er wird hauptsächlich durch die Untergruppe der
Franzosen hervorgerufen, die mit 0.575 signifikant besser korrelieren als die
anderen. Die weiblichen Versuchspersonen zeigen ebenfalls eine geringfügig
erhöhte Gruppenkorrelation (0.456), die allerdings ebenfalls nicht
signifikant ist. Somit kann Hypothese 3 auf der Basis der hier vorliegenden
Daten nicht bestätigt werden.
36
Abb. 3.7 gibt die Korrelationen zwischen den Versuchspersonen graphisch
wieder. Die zweidimensionalen Positionen wurden so gewählt, daß die
Abstände so gut wie möglich proportional zu -log(r) sind. Je besser die
Korrelation, desto geringer der Abstand. Außerdem wurde die Linienstärke
entsprechend der Korrelation gewählt. Aus Abb. 3.7 wird deutlich, daß
kulturelle oder geschlechtsspezifische Abhängigkeiten im Sinne von
Hypothese 3, wenn sie überhaupt existieren, vernachlässigbar sind.
Lediglich die Untergruppe der Franzosen ist auch in dieser Abbildung gut
vom Rest separierbar. Dies könnte ein Zufall sein. Man muß allerdings
berücksichtigen, daß zum Zeitpunkt des Experiments alle Versuchspersonen
seit mindestens einem Jahr in Frankreich lebten. Somit lebten die beiden
anderen Untergruppen in einem sprachlichen Umfeld, daß ihrer
Muttersprache nicht entspricht. Würde man die Studie wiederholen, aber in
Abb. 3.7: Graphische Darstellung der Korrelationen zwischen den
verschiedenen Versuchspersonen. Eine gute Korrelation zwischen zwei
Versuchspersonen drückt sich zum einen in der Nähe der Positionen, zum
anderen in der Linienstärke aus. Es ist keine kulturelle Gruppierung
erkennbar.
37
drei verschiedenen Ländern durchführen, so könnten eventuell vorhandene
Unterschiede besser herauskommen.
III. Zusammenfassung
Das Tappen zu periodischem Rauschen ist nicht nur konsistent innerhalb
einer Darbietung (Limbert und Patterson, 1982), sondern auch in einem
hohen Grad reproduzibel in späteren Darbietungen desselben Stimulus
(Hypothese 1). Zweideutige Rauschproben rufen eventuell zwei
verschiedene bevorzugte Tappzeitpunkte hervor. In diesem Fall ist der
zweite Tappzeitpunkt oft eine halbe Periode vom ersten entfernt. Dies
spricht für eine Art „rhythmischer Verstärkung“ eines weniger salienten
Details durch ein stark salientes Detail, wenn der Abstand zwischen ihnen
genau einen halben Zyklus beträgt. Wenn z.B. in einer Rauschprobe vier
Perzepte (a,b,c,d) ungefähr gleichabständig verteilt sind, und wenn für die
Versuchsperson Perzept (a) am salientesten klingt (also: ... d a b c d a b c d a
b c ...), dann würde sie auf die Frage nach dem zweitbesten Perzept
wahrscheinlich (c) benennen.
Darüber hinaus gibt es eine überzufällige Korrelation zwischen den
Tappzeitpunkten verschiedener Versuchspersonen (Hypothese 2). Die
unterstellten Abhängigkeiten von der Muttersprache bzw. dem Geschlecht
(Hypothese 3) konnten hingegen nicht bestätigt werden. Offensichtlich
beruhen die Vorgänge, die bei periodischem Rauschen zur Wahrnehmung
der Perzepte führen, auf vergleichbaren Analysen der physikalisch
gegebenen Stimulusmuster. Daher kann (auch und gerade mit Mittappen als
methodischem Ansatz) die Frage angegangen werden, welche
physikalischen Eigenschaften der zufälligen Wellenform bei weißem
Rauschen zu einem salienten Perzept führen, und welche nicht. Dies ist das
Anliegen der nächsten vier Abschnitte (3.4-3.7). Selbst wenn die
Wahrnehmung von periodischem Rauschen für alle Zuhörer eindeutig und
dieselbe wäre, würde man keine perfekte Korrelation erwarten. Auch die
rhythmische Organisation des Gehörten unterliegt interindividuellen
Schwankungen. Zyklische Muster besitzen keinen gut definierten
Startpunkt. Um Unterschiede in der Wahrnehmung (im Gegensatz zu
solchen in der perzeptuellen Organisation) herauszuarbeiten, werden die
lokalen physikalischen Träger der Perzepte in den nächsten Abschnitten
herausgearbeitet.
38
3.4 Holistische vs. lokale Verarbeitung von periodischem
Rauschen
Brubaker und Warren (1987) untersuchten die Frage, ob die Wahrnehmung
von periodischem Rauschen auf Singularitätsentdeckung oder auf
ganzheitlicher (holistic) Musterverarbeitung beruhe. Sie konnten
nachweisen, daß Versuchspersonen leicht zwischen zyklischen Darbietungen
von Folgen von drei Rauschsegmenten unterscheiden konnten, die sich nur
in der Anordnung dieser drei Segmente (ABC versus CBA) unterschieden.
Sie folgerten, daß die Wahrnehmung von periodischem Rauschen nicht nur
auf Singularitätsentdeckung beruhen könne, sondern mindestens auch eine
holistische Verarbeitung des gesamten Musters beinhaltet. Dies ist
vergleichbar zu ähnlichen Effekten, wie sie bei Studien mit schnellen
zyklischen Folgen kurzer Töne (z.B. Warren und Ackroff, 1976) gefunden
wurden. Es zeigt sich in der Regel, daß die Folgen unterschieden werden
können, auch wenn die Reihenfolge der Töne nicht korrekt wiedergegeben
werden kann.
Mit ihrer Studie haben Brubaker und Warren gezeigt, daß eine holistische
Mustererkennung eine Rolle spielt. Sie haben die Beteiligung einer
Singularitätsentdeckung jedoch weder bewiesen noch ausgeschlossen. Es ist
nicht ganz abwegig, zu unterstellen, daß es sich bei periodischem Rauschen
vorwiegend um eine holistische Verarbeitung handelt. Schließlich sind die
einzelnen Elemente nicht hörbar, wenn sie nicht in zyklischer Wiederholung
geboten werden. Dies ist anders als bei den anderen zum Vergleich
herangezogenen schnellen zyklischen Folgen, bei denen jedes einzelne
Element für sich genommen gut hörbar ist und daher eines davon die
anderen im Sinne einer Singularität an Salienz übertreffen könnte.
Um zu erläutern, was eine holistische Verarbeitung für Konsequenzen hätte,
sei eine Studie von Preusser (1972) zitiert. Preusser verwendete Tonfolgen,
die aus lediglich zwei verschiedenen Tönen (nennen wie sie A und B)
bestehen. Eine kurze Abfolge dieser beiden Töne (z.B. AABABBBBABA)
wurde nun zyklisch präsentiert, und die Versuchspersonen sollten angeben,
wo sie den Startpunkt dieser zyklischen Folge hören. In diesem Fall ist eine
Singularitätsverarbeitung weitestgehend ausgeschlossen, da die einzelnen
39
Elemente kaum unterschiedlich salient sein können, solange der
Frequenzabstand zwischen A und B gering gehalten wird. Selbst ein
geringfügiger Salienzunterschied zwischen A und B besäße kaum
Erklärungswert, da sowohl A als auch B viele Male in der Abfolge
vorkommen. Preusser beobachtete nun, daß als Startpunkt am häufigsten der
Start (und etwas weniger häufig: das Ende) der längsten Folge von
identischen Tönen gewählt wurde, in diesem Beispiel also das erste oder das
letzte B des Vierer-B-Blocks. Dies ist in der Tat eine holistische Regel, denn
nur, wenn das ganze Muster bekannt ist und berücksichtigt wird, kann
bestimmt werden, wo die längste Folge identischer Töne beginnt bzw. endet.
Wenn man einen einzigen Ton so einer Folge ändert, stört man evtl. die
längste Sequenz, oder man erzeugt eine längere Folge an anderer Stelle (z.B.
durch Verändern des ersten B's zu A erzeugt man einen Fünfer-A-Block:
AAAABBBBABA).
Für die weitere Theoriebildung zur Wahrnehmung von periodischem
Rauschen ist es wichtig, zu überprüfen, ob Singularitätsentdeckung eine
Rolle spielt oder nicht. Wenn nämlich Singularitäten die Basis der
Verarbeitung bilden, dann stellt sich die Frage, warum man diese
normalerweise nicht hört. Eine ausführlichere Diskussion dieser Frage findet
sich in Kapitel 6.1 und 6.2. Als Kriterium einer rein holistischen
Interpretation kann man festhalten, daß geringfügige Änderungen zu
deutlichen Veränderungen der gehörten Struktur führen. Ist die holistische
Verarbeitung jedoch lediglich einer lokalen Verarbeitung nachgeschaltet
(z.B. Rhythmisierung von lokal hörbar gewordenen Details), dann sollten
auch große Veränderungen der Wellenform, solange sie nur bestimmte
lokale Bereiche intakt lassen, die Reaktion der Versuchsperson kaum
beeinflussen. Da in Experiment 1 gezeigt worden ist, daß die
Versuchspersonen in der Regel in der Lage sind, dieselben Tappzeitpunkte in
späteren Darbietungen zu reproduzieren, können in den beiden folgenden
Experimenten die dargebotenen Rauschproben verändert werden und es
kann beobachtet werden, inwieweit diese Veränderung das Tappen der
Versuchspersonen beeinflußt. Dabei soll die folgende Hypothese überprüft
werden:
HYPOTHESE:
Die Wahrnehmung der Perzepte in periodischem Rauschen, die auf intraindividuell
reproduzierbaren und interindividuell korrelierten Gesetzmäßigkeiten der
40
Strukturbildung beruht, bezieht sich dabei auf lokale Eigenschaften des Stimulus,
und nicht auf die Gesamtheit der Periode. Dabei wird lokal sowohl im temporalen als
auch im spektralen Sinne verstanden, d.h. es läßt sich im Spektrogramm eine Region
eingrenzen, die Träger derjenigen Merkmale ist, die das Perzept hervorrufen.
Empirisch müßte sich das daran erweisen, daß Manipulationen an anderen Stellen
des Spektrogramms den Tappzeitpunkt nicht verändern.
3.5 Experiment 2: Temporale Eingrenzung
I. Methodik
Die Erzeugung des Rauschens erfolgte wie in Experiment 1. Diesmal kam
aber nur Index 1 zur Anwendung. Sechs Sekunden von Index-1-Rauschen
wurden erzeugt und im Speicher des Computers abgelegt. Zu jedem
Einzelversuch wurde an einer zufällig gewählten Stelle ein Segment aus
diesem Rauschen herausgeschnitten und zyklisch präsentiert. Dabei wurde
darauf geachtet, daß aufeinanderfolgende Einzelversuche nie einander
überlappende Segmente verwendeten. Die Länge des Segments war 400,
600 oder 800 ms, in zufälliger Reihenfolge. Die Schalldarbietung erfolgte
wie in Experiment 1. Die gesamte 6 Sekunden lange Rauschprobe würde,
zyklisch präsentiert, kaum als periodisch wahrgenommen werden. Die
kurzen Segmente hingegen erzeugen gut wahrnehmbare periodische
Strukturen. Indem gemessen wird, wo darin jeweils der Schwerpunkt gehört
wird, kann untersucht werden, inwieweit dies vom Startpunkt und der Länge
abhängt. Abb. 3.8 erläutert die Generierung des Rausches graphisch.
6 Sekunden weißes Rauschen im Speicher des Computers
800 ms Segment an zufälliger
Stelle herausschneiden
und als Zyklus präsentieren
Abb. 3.8: Graphische Erläuterung der Stimulusgenerierung in Experiment 2 am
Beispiel eines 800-ms periodischen Rauschens.
41
Die Versuchspersonen wurden instruiert, im gehörten Rhythmus
mitzutappen. Im Gegensatz zu Experiment 1 wurde diesmal nicht dazu
angehalten, eine bestimmte Komponente (weil kürzer oder prägnanter) den
anderen vorzuziehen, sondern sie sollten tappen zu was immer ihnen gerade
passend vorkam. Jeder Einzelversuch startete zwei Sekunden nach dem
vorhergehenden und endete, wenn die Versuchsperson achtmal getappt hatte.
Das nachträgliche Ausschlußkriterium bzgl. der Tappräzision war wie in
Experiment 1.
Ein Einzelversuch dauerte etwa 12 Sekunden. Die Versuchspersonen führten
jeweils ca. 1000 Einzelversuche durch. Onset- und Offsetrampen waren
cosinusoidal über 20 ms, und ein zufälliger Anteil des ersten Zyklus wurde
weggelassen, um nicht schon durch den Einstiegspunkt einen Bias
auszulösen.
Fünf Versuchspersonen nahmen an dieser Studie teil. Zwei hatten bereits an
Experiment 1 teilgenommen (CK=D1, ME=D3). Die anderen
Versuchspersonen erhielten zuvor mindestens eine Stunde entsprechendes
Training.
II. Ergebnisse
Jeder Einzelversuch ist vollständig beschrieben durch die Angabe der
Startposition des herausgeschnittenen Segments, seiner Länge, und dem von
der Versuchsperson gewählten Tappzeitpunkt. Abb. 3.9 zeigt die Ergebnisse
von Experiment 2. Die horizontale Achse entspricht den sechs Sekunden
weißen Rauschens, die im Computerspeicher abgelegt waren. Jeder
Tappzeitpunkt in einem Segment läßt sich unter Berücksichtigung des
Startpunktes dieses Segmentes auf die sechs Sekunden beziehen: er
entspricht einen Zeitpunkt innerhalb dieser sechs Sekunden auf der x-Achse.
Die Punkte wurde entsprechend der Startzeitpunkte der Segmente vertikal
versetzt. Dadurch liegen die Daten zu einer Versuchsperson in einem
diagonalen Balken.
Ein Beispiel möge diese Art der Darstellung erläutern. Nehmen wir an, in
einem Einzelversuch sei das Segment von 3.4 bis 4.2 Sekunden zyklisch
präsentiert worden. Die Versuchsperson habe den Zeitpunkt 0.2 (bezogen
auf dieses Segment) getappt. Bezogen auf die gesamte 6-s Rauschprobe,
kann ihr Tappzeitpunkt als 3.6 angegeben werden. In Abb. 3.9 ist dieses
42
Beispiel im diagonalen Balken unten rechts dargestellt. Die obere der beiden
horizontalen Linien wurde so gewählt, daß das Segment [3.4,4.2] im
diagonalen Balken liegt. Sie beschreibt das Segment über seine ganze
Länge, so daß das Versuchsergebnis irgendwo auf dieser Linie liegen muß.
Konkret liegt es bei dem mit A bezeichneten Kreis, da die Versuchsperson
bei 3.6 getappt hat. Wenn in einer anderen Darbietung das Segment 3.2 bis 4
Sekunden herausgeschnitten und angeboten wird (untere der beiden
horizontalen Linien), und die Versuchsperson tappt wieder bei 3.6, dann
liegt dieser Punkt (B) vertikal unter dem Punkt A. Vertikal angeordnete
Punkte deuten also darauf hin, daß die Versuchsperson einen bestimmten
Zeitpunkt im Rauschen signifikant findet, obwohl andere Teile des
Rauschens ausgetauscht worden sind.
43
Abb. 3.9: Punktplot der getappten Zeitpunkte, bezogen auf die 6-s Rauschprobe
(horizontale Achse). Die Ordinate entspricht dem Startzeitpunkt des Segmentes
innerhalb der 6-s Rauschprobe. Für jede VP sind drei diagonale Balken für die
Segmentlängen 400/600/800 ms eingezeichnet. Das Beispiel rechts unten wird im
Text erläutert. Die vertikale Ausrichtung der Punkte zeigt, daß die Wahrnehmung der
Perzepte von der kontinuierlichen Darbietung nur eines kleinen Stückchens der
Rauschprobe abhängt.
44
Für jede Versuchsperson sind drei solcher diagonaler Balken eingetragen,
entsprechend den drei verschiedenen Periodenlängen. Man erkennt eine
starke Tendenz zur vertikalen Ausrichtung der Punkte. Die vertikalen Linien
gehen bis knapp an den Rand der diagonalen Balken, was anzeigt, daß der
größte Teil der Rauschprobe ausgetauscht werden kann, ohne daß das
saliente Detail seine Signifikanz verliert. Versucht man, anhand der Linien
die Ausdehnung der lokalen physikalischen Basis für das Perzept
abzuschätzen, dann kommt man zu einem Wert unterhalb von 100 ms. Bei
einer größeren Ausdehnung müßte ein Abbrechen der Linien vor dem
Erreichen des Randes beobachtet werden. Wenn z.B. für ein bestimmtes
Perzept ein kontinuierliches Stück von 400 ms Länge erforderlich wäre,
dann wäre die vertikale Linie höchstens so lang wie das Segment minus 400
ms. Bezogen auf die Zeitachse kann die Hypothese der lokalen Verarbeitung
bestätigt werden.
Auch die Größe des Segmentes hat wenig Einfluß auf die Salienz der
enthaltenen lokalen Eigenschaften: Vertikale Linien, die sich im 800-ms
Balken finden, setzen sich meistens auch in den 600- und den 400-ms
Balken fort. Umgekehrt finden sich allerdings für die kürzeren
Segmentlängen saliente Tappzeitpunkte, die sich bei den längeren
Segmenten nicht mehr wiederfinden. Dies ist aber leicht zu verstehen, wenn
man sich vorstellt, daß z.B. 300 ms vor und nach so einem salienten Detail
etwas stärker saliente Eigenschaften in der Wellenform vorkommen. Bei der
größeren Segmentlänge wäre dann das schwach saliente Detail immer in
Begleitung von stärker salienten Eigenschaften und würde daher nie als
Schwerpunkt empfunden.
Die Übereinstimmung zwischen Linien bei verschiedenen Versuchspersonen
ist teilweise bemerkenswert. Mehrere Linien können für drei oder mehr
Versuchspersonen gefunden werden (0.3, 0.8, 2.4, 3.6, 4.2, 5.2). Aber es gibt
auch deutliche Unterschiede zwischen den Versuchspersonen. So ist z.B. bei
5.0 nichts Auffälliges für Versuchsperson CK, während für Versuchsperson
ME dort ein sehr deutliches Perzept hervorgerufen wird. Dies kann mit den
Ergebnissen von Experiment 1 verglichen werden, wo ebenfalls eine
gewisse, aber nicht vollständige Korrelation zwischen den Versuchspersonen
bestand.
45
3.6 Experiment 3: Spektrale Eingrenzung
Nachdem in Experiment 2 deutlich wurde, daß ein zeitlich eng begrenztes
Stück des Rauschens die Basis für ein hörbar gewordenes Perzept enthält,
stellt sich die Frage, ob man die physikalische Basis auch spektral
eingrenzen kann. Bisherige Experimente konnten zeigen, daß auch bei tief-,
hoch- und bandpaßgefilterten Versionen von periodischem Rauschen die
Periodizität entdeckt werden kann (z.B. Warren und Bashford, 1981).
Dadurch wissen wir allerdings nicht, inwieweit sich dabei die Perzepte
änderten, ob also durch das Filtern andere Details der Wellenform salient
wurden. Somit können wir nicht abschätzen, ob in normalen weißem
Rauschen breitbandige oder eher schmalbandige Signaleigenschaften
ausgenutzt werden.
I. Methodik
A. Stimulus und Datenanalyse
Die oberen Teilbilder von Abb. 3.10 zeigen, wie der Stimulus für
Experiment 3 konstruiert wurde. Links oben sehen wir die Darstellung des
Spektrogramms einer fiktiven Rauschprobe der Länge . Die Symbole
(Dreiecke, Quadrate, Kreise) sollen für fiktive, temporal und spektral gut
eingrenzbare Details der Wellenform stehen, die gut hörbare Perzepte
auslösen. Nun wird bei einer zufällige gewählten Frequenz f (gleichverteilt
auf einer logarithmischen Skala zwischen 100 und 10000 Hz, hier: 700 Hz)
in einen Hochpaß– und einen Tiefpaßteil getrennt (gestrichelte Linie). Dies
erfolgte mit Hilfe eines FFT-Algorithmus mit rechteckigen Flanken. Dann
wird der Tiefpaßteil gegenüber dem Hochpaßteil um einen zufälligen Betrag
t verschoben (dies läßt sich durch Drehung der FFT-Komponenten
bewerkstelligen) und die beiden Teile wieder zusammengesetzt. Die
Symbole im Tiefpaßteil sind nun gegenüber dem Hochpaßteil verschoben.
Der Tappzeitpunkt kann nun wahlweise bezüglich des Hochpaßteils (t) oder
des Tiefpaßteils (t' = t  t) beschrieben werden. Wenn das Element
oberhalb der Schnittfrequenz (im Hochpaßteil) lag, dann sollte sich bei einer
nachfolgenden Präsentation mit ähnlicher Schnittfrequenz (aber anderem t)
derselbe Wert für t ergeben. Der Wert für t' sollte hingegen randomisiert
werden, da er sich aus dem konstanten t und dem zufälligen t zusammen
setzt. Wenn das Element dagegen im Tiefpaßteil enthalten ist, dann würde
46
bei ähnlichen Schnittfrequenzen t' konstant bleiben und t randomisiert
werden. Jeder Einzelversuch wird komplett beschrieben durch die Angabe
dreier Parameter: der Schnittfrequenz f, der Koordinate t des
Tappzeitpunktes bzgl. des Hochpaßteils, und der Koordinate t' bzgl. des
Tiefpaßteils. Die beiden letzten Parametern sind über die Verschiebung t =
t  t' miteinander verknüpft.
In den unteren Teilbildern von Abb. 3.10 wird anhand von Beispielsdaten
beschrieben, wie die Daten bzgl. dieser drei Parameter geplottet wurden.
Wenn wir wüßten, ob ein bestimmter Einzelversuch ein Tappen zu einem
Element im Hochpaßteil oder im Tiefpaßteil ausgelöst hat, dann könnten wir
auf einen der drei Parameter verzichten, da er ja ohnehin randomisiert ist.
Wir würden dann die Daten zweidimensional plotten (Ordinate:
Schnittfrequenz, Abszisse: relevante Koordinate, t oder t'), und nur durch die
Farbe oder Punktgröße deutlich machen, ob es sich um ein Hochpaßtappen
oder ein Tiefpaßtappen handelte.
Abb. 3.10: Stimuluskonstruktion und Datenanalyse für Experiment 3. Die Ordinate
repräsentiert die Schnittfrequenz zwischen Hoch- und Tiefpaßteil, die Abszisse den
Zeitpunkt innerhalb der Rauschprobe der Länge . Die oberen beiden Teilbilder
beschreiben die Stimuluskonstruktion (siehe Text). In den beiden ersten Teilbildern
der unteren Reihe sind beispielhafte Daten bzgl. der Hochpaßkoordinate t, bzw. bzgl.
47
der Tiefpaßkoordinate t' dargestellt. Das letzte Teilbild kombiniert diese beiden
Darstellungen (siehe Text).
Im Teilbild links unten sind die Beispielsdaten bzgl. der Hochpaßkoordinate
t geplottet (Ordinate: Schnittfrequenz), im Teilbild unten Mitte hingegen
bzgl. der Tiefpaßkoordinate t'. Man erkennt, daß konsistentes
Hochpaßtappen auftritt, solange die Schnittfrequenz unterhalb von 500 Hz
liegt. Liegt sie oberhalb von 1200 Hz, tritt konsistentes Tiefpaßtappen auf.
Zwischen 500 und 1200 Hz scheint sich das Element aufzuteilen, denn es
wird teilweise konsistent in t, teilweise konsistent in t' getappt. Das erkennt
man daran, daß keine vollständige Randomisierung auftritt, sondern sich die
vertikalen Linien teilweise in dieses Gebiet fortsetzen. Man kann allerdings
nicht erkennen, ob alle Punkte in diesem Bereich entweder zu t oder zu t'
konsistent sind.
Im Teilbild rechts unten sind dieselben Daten entweder bzgl. t (große graue
Punkte) oder bzgl. t' (kleine schwarze Punkte) dargestellt. Dazu wurde für
jeden Punkt ermittelt, ob er mehr Nachbarn im t-Plot oder im t'-Plot hat.
Dabei wurden in beiden Plots für jeden Punkt attraktive Potentiale
aufsummiert, wobei benachbarte Punkte größere Beiträge lieferten als
weniger benachbarte Punkte. Die Ausdehnung des attraktiven Potentials war
ca. 1 Oktave auf der Ordinate, und ca. /6 auf der Abszisse. Als relevante
Koordinate wurde dann diejenige Koordinate ausgewählt, für die sich mehr
attraktives Potential aufsummiert hatte. Zur Kennzeichnung, welche
Koordinate dies sei, wurde der Farbwert (schwarz/grau) und die Punktgröße
verändert. In diesem Teilbild erkennt man, daß fast alle Punkte einem
konsistenten Tappen entweder in t oder in t' entsprechen, mit Ausnahme des
Punktes bei 2000 Hz am rechten Rand. Zwischen 500 und 1200 Hz
überlagern sich die Punktwolken: Hier ist konsistentes Tappen zu t oder zu t'
möglich. Die Konsistenz des Tappens läßt im Überlagerungsgebiet nach: die
vertikalen Punktwolken fächern sich auf.
B. Versuchspersonen und Prozedur
An diesem Experiment wirkten dieselben fünf Versuchspersonen wie bei
Experiment 2 mit. Sie waren somit schon hochtrainiert und brauchten kein
weiteres Training. Die Instruktion war wieder wie bei Experiment 1:
Möglichst genau überlegen, welches Perzept am deutlichsten, lautesten,
betontesten ist, bzw. bei Zweideutigkeiten sich für das zeitlich begrenztere
48
entscheiden. Der Grund dafür ist, daß daran gelegen war, daß sich das
Tappen auf ein und dieselben Elemente bezieht. In Pilotuntersuchungen war
deutlich geworden, daß es schwierig ist, mit einer einzigen Rauschprobe zu
arbeiten, da die teilweise, aber nicht vollständige Ähnlichkeit bei
aufeinander folgenden Einzelversuchen irritierte und Voreinstellungen
auslöste (wie etwa den Versuch, konsistenzhalber etwas wiederzufinden,
was im letzten Einzelversuch eine Rolle spielte, nun aber vielleicht gar nicht
existiert). Daher wurden fünf verschiedene Rauschproben in zufälliger
Reihenfolge ausgewählt. Um den FFT-Algorithmus anwenden zu können,
wurde die Länge so gewählt, daß die Anzahl der Sampledaten eine
Zweierpotenz ergab: 819.2 ms entsprechen 214 Datenpunkten bei einer
Digitalisierungsfrequenz von 20 kHz. Die Rauschproben waren aus den
sechs Sekunden weißen Rauschens, die bei Experiment 2 verwendet
wurden, an folgenden Positionen herausgeschnitten: [0.2,1.0192] (A),
[1.2,2.0192] (B), [3.0,3.8192] (C), [4.0,4.8192] (D), und [4.8,5.6192] (E).
Die Versuchspersonen führten zwischen 700 und 1700 Einzelversuche
durch.
II. Ergebnisse
In Abb. 3.11 sind die Daten der fünf Versuchspersonen für die fünf
verschiedenen Rauschproben in Form von t/t’-Plots aufgetragen. Betrachten
wir zunächst Teilbild <B,FC>. Das Perzept erscheint eindeutig, solange die
Schnittfrequenz oberhalb von 2200 oder unterhalb von 500 Hz ist. Zwischen
diesen beiden Frequenzen ist das Perzept zerstört, und die Versuchsperson
wählt einen anderen Tappzeitpunkt. Es findet kein langsames Ausschleichen
(etwa gelegentliches konsistentes Hochpaßtappen bei einer Schnittfrequenz
von 700 Hz) statt, sondern ein recht abrupter Wechsel. Hier handelt es sich
offensichtlich um ein Merkmal, daß durch die Interaktion zwischen zwei
Kanälen definiert wird. Es könnte sich um Amplitudenkomodulationen
zweier getrennter Kanäle handeln, wie sie in der derzeitigen Diskussion als
Konstituenten der auditiven Szenenanalyse sehr aktuell sind (einen
Überblick gibt Moore, 1990). Wird die Zeitbeziehung der interagierenden
Kanäle gestört, dann ist das Merkmal verschwunden. In zwei anderen
Teilbildern kann man ähnliches finden: <D,DM> und <E,ME>. Bei dem in
<E,ME> erfaßten Merkmal handelt es sich im übrigen um das schon in
Experiment 2 erwähnte, für Versuchsperson CK nicht saliente Merkmal. Die
49
Statistik der fünf pro Versuchsperson erfaßten Merkmale reicht leider nicht
aus, um zu entscheiden, ob es konsistente interindividuelle Unterschiede bei
der Wahrnehmbarkeit solcher Interaktionen gibt.
In den anderen Teilbildern finden sich meist mehr oder weniger breite
Übergangsregionen, wo konsistentes Tappen zu t oder t' auftreten kann. Der
Übergang kann ziemlich scharf sein (z.B. innerhalb eines Dritteloktavbandes
in <D,FC>), oder sich über 1.5 Oktaven erstrecken wie in <A,ME>. In
diesem letzteren Falle muß man wohl eine Art spektraler
Informationsintegration annehmen, bei der die Salienz des Perzepts aus über
einen breiten Spektralbereich verteilten Eigenschaften der Wellenform
abgeleitet wird. Bei einem Schnitt in der Mitte dieses Bereiches bleiben in
jedem Teilbereich genügend Merkmale übrig, um ein salientes Perzept zu
ergeben.
Abb. 3.11: Daten für fünf Versuchspersonen und fünf verschiedene Rauschproben
(A-E) in Experiment 3. Die Ordinate gibt für jeden Einzelversuch die
Schnittfrequenz wieder, die Abszisse gibt den Tappzeitpunkt entweder in der
50
Hochpaßkoordinate t (graue Punkte) oder in der Tiefpaßkoordinate t' (schwarze
Punkte) wieder. Anhand der Breite der Übergangsregion kann die spektrale
Ausdehnung des Elements bestimmt werden.
Einige Teilbilder zeigen für eine bestimmte Rauschprobe eine
bemerkenswerte Übereinstimmung für verschiedene Versuchspersonen. So
weisen in <D,MC/FC>, <E,FC/DM> und <A,CK/ME/DM> die salienten
Elemente eine fast identische spektrotemporale Lokalisation auf. Es fällt
allerdings auf, daß nicht immer eine gute zeitliche Übereinstimmung auch
eine gleiche spektrale Lokalisation des Elementes bedeuten muß: so haben
bei Rauschprobe C Versuchspersonen CK und ME wohl auf verschiedene
Perzepte geachtet, die nur zufällig zum gleichen Zeitpunkt eintraten.
3.7 Analyse des Spektrogramms
Mit Experiment 2 und 3 konnte die am Ende von Abschnitt 3.4 aufgestellte
Hypothese bestätigt werden. Beim Hören von sich wiederholendem weißen
Rauschen verstärkt das auditorische System temporal und spektral begrenzte
Details der Wellenform, die wir sonst nicht wahrnehmen würden. Die
physikalische Basis der resultierenden Perzepte läßt sich zeitlich auf 100 ms
eingrenzen. Die spektrale Ausdehnung liegt zwischen 1/3 und 1.5
Oktavbändern. Guttman und Julesz (1963) haben angenommen, daß die
Wahrnehmung von periodischem Rauschen auf Energiegipfeln im
Kurzzeitspektrum basiert. Limbert (1984) hat vergeblich versucht, solche
Energiegipfel zu finden. Auf der Basis der Experimente 2 und 3 kann nun
genauer hingeschaut werden, da für einige Perzepte sowohl das Zeitfenster
als auch die spektrale Ausdehnung bekannt sind. Man kann an der
entsprechenden Stelle im Spektrogramm nachschauen, welche Auffälligkeit
zu einem salienten Perzept geführt haben mag. Abb. 3.12 zeigt exemplarisch
das Spektrogramm der Rauschprobe E. Das für FC und DM salienteste
Perzept, spektral auf 1/3 Oktave eingrenzbar, basiert auf der eingekreisten
Region des Spektrogramms.
Man findet an dieser Stelle keinen deutlichen Energiegipfel. Der im rechten
unteren Quadranten des Kreises befindliche kleine schwarze Fleck ist nicht
besonders auffällig: Es gibt viele andere Gebiete ähnlicher Ausdehung und
Schwärzung. Das gilt auch für die für andere Versuchspersonen
signifikanten Regionen, z.B. CK: <450ms, 700Hz>. – Eigentlich ist es nicht
51
überraschend, daß man mit dem Auge nicht ausmachen kann, welche Region
eines Spektrogramms als salient empfunden werden wird. Die visuelle
Beurteilung erfolgt mit Hilfe visueller Gestaltgesetze, die den auditiven
Gestaltgesetzen nicht ähnlich sein müssen. Bei <E,ME> liegt ein Element
vor, das auf einer Interaktion verschiedener, getrennter Kanäle beruht: Bei
ca. 200 ms könnte eine Komodulation zwischen den Frequenzen 300-500
Hz einerseits und 2000-3000 Hz andererseits vorliegen. Es ist kaum
vorstellbar, daß man diese Interaktion mittels visueller Inspektion des
Spektrogramms erkennt.
52
10000
Hz
1000
100
0
100
200
300
400
500
600
700
800 ms
Abb. 3.12: Spektrogramm der Rauschprobe E aus Experiment 3. Der Kreis
entspricht dem für Versuchspersonen FC und DM signifikanten Perzept. Er enthält
keinen deutlich aus dem Grauwertmuster herausstechenden Energiegipfel. – Die
Frequenzskala ist logarithmisch, da dies der Ordinate in Abb. 3.11 und der
Frequenztransformation auf der Basilarmembran entspricht. Aus jeweils 512 Punkten
(25.6 ms) wurde ein Spektrum berechnet, mit einem cosinusoidalen Fenster (raised
cosine). Dadurch werden effektiv 12.8 ms repräsentiert. Alle 5.12 ms (40% der
effektiven Fensterbreite) wurde ein Spektrum berechnet, und zwar mit vierfachem
oversampling, um bei der logarithmischen Transformation der Ordinate nicht zu
viele Details im oberen Frequenzbereich zu verlieren. Die Grauwerte repräsentieren
die logarithmierte Energie über einen Bereich von 60 dB.
Andererseits macht die visuelle Inspektion des Histogramms deutlich, daß es
hinreichend viele Möglichkeiten für das auditive System gäbe, saliente
Perzepte zu erzeugen. Die Art von Schwankungen, die in dem weißen Kreis
liegen, sind auch an vielen anderen Stellen zu finden.
53
3.8 Auditive feature Detektoren
Die Energiegipfel im Spektrogramm einer periodischen Rauschprobe
kommen zwar ebenfalls periodisch vor und sind somit grundsätzlich
geeignet, die Entdeckbarkeit der Periodizität in periodischem Rauschen zu
erklären. Sie können hingegen nicht erklären, wieso gerade diese oder jene
Stelle im Spektrogramm mit einiger Zuverlässigkeit ein Perzept auslöst.
(Die darüber hinausgehende Frage, warum nichtrepetiertes Rauschen nicht
gleichfalls vielfältige Perzepte auslöst, wird hier noch nicht behandelt. Siehe
hierzu Kapitel 6.1 und 6.2). Es wäre wünschenswert, die Charakteristiken
der auditiven Detektoren zu kennen, die aus dem Schallsignal die für den
Hörer relevanten Eigenschaften (features) herausfiltern. Dann könnte
sozusagen das „innere“ Spektrogramm bestimmt werden, mit dessen Hilfe
die möglichen Perzepte vorhersagbar wären.
Es sei vorweg angemerkt, daß dieses Ziel zur Zeit nicht erreichbar ist. Aber
die vorhandene empirische Evidenz erlaubt es immerhin, über die
Eigenschaften der Detektoren nachzudenken, die zu der beobachteten inter–
und (in gewissem Maße) intraindividuellen Reproduzierbarkeit führen.
Zunächst sollen jedoch Ergebnisse aus der visuellen Wahrnehmung
vorgestellt werden, die einen Ausblick auf die Art der zu erwartenden feature Detektoren geben.
Visuelle Information kann in bildverarbeitenden Systemen pixelweise als
Farbinformation gespeichert werden. Dies ist aber nur für unkorrelierte
Bilder
(z.B.
Abb. 3.13: Ein Gabor wavelet wird
gekennzeichnet durch die Orientierung (hier:
45°) und die Raumauflösung. Das hier
gezeigte wavelet wäre ungeeignet, die
Buchstaben dieses Textes aufzulösen, aber
gut geeignet für gröbere Strukturen, z.B. den
Seitenrand.
54
Zufallspunktemuster) optimal. Wenn man eine große Zahl „normaler“
Bilder, wie sie in der Umwelt vorkommen, auf ihre Hauptkomponenten analysiert, erhält man Filter ähnlich den Gabor wavelets (Abb. 3.13). Jedes Bild
kann anstelle der Pixelkodierung als Satz von Gabor-Filterkoeffizienten
kodiert werden. Es hat sich herausgestellt, daß das visuelle System Bilder in
Form derartiger wavelets verarbeitet, d.h. daß die Rezeptoren des primären
visuellen Kortex Bilder wavelet-artig zerlegen (Daugman, 1980, 1985,
MacKay, 1981, DeValois und DeValois, 1988).
Es liegt nahe, zu prüfen, ob ähnliche Typen von Detektoren auch im
auditiven System gefunden werden können. Bisher hat es keine
Hauptkomponenten-Analyse auditiver Umweltstimuli gegeben. Es gibt aber
aus der Physiologie Hinweise, daß wavelet–ähnliche Strukturen im
Spektrogramm eine Rolle spielen können. So ist seit einiger Zeit bekannt,
daß Töne nicht nur eine spektrale Zerlegung im Innenohr erfahren, sondern
daß auch die zeitliche Feinstruktur der Erregung analysiert wird. Wenn die
Prinzipien dieser Wirkmechanismen auch noch nicht verstanden sind
(Kaernbach und Demany, 1998), so sind doch schon seit einiger Zeit aus
elektrophysiologischen
Untersuchungen
tonotop/periodotope
Repräsentationen bekannt (Langner, 1992), also Karten in Bereichen des
Mittelhirns, die entlang zweier Dimensionen geordnet sind: spektrale
Tonhöhe und temporale Feinstruktur. Der optimale Stimulus für ein
derartiges Neuron ist offensichtlich eine Art wavelet im Spektrogramm.
Andererseits reichen wavelets sicher nicht aus, um die für die auditive
Signalverarbeitung so wichtigen Transienten zu erfassen. Hier wurden
Kombinationen aus zwei wavelets vorgeschlagen, die unterschiedliche
Frequenzbereiche mit einer voreingestellten zeitlichen Verzögerung
erfassen.
Am Anfang dieses Abschnitts war die Frage aufgeworfen worden, wie die
beobachtete Reproduzierbarkeit der Tappzeitpunkte erklärt werden kann. Es
gibt ganz offensichtlich erheblich mehr feature Detektoren als
Frequenzkanäle. Das „innere“ Spektrogramm enthält also im Vergleich zu
Abb. 3.12 eine viel längere Ordinate und damit zunächst einmal mehr
Möglichkeiten für Vieldeutigkeiten. Der Ausgang eines Detektors, der mit
weißem Rauschen stimuliert wird, ist ebenfalls ein Rauschen. Allerdings ist
für Detektoren, die ihre Information über die Zeit integrieren, zu erwarten,
daß sie als eine Art Tiefpaß fungieren, d.h. daß am Ausgang ein
55
tieffrequenteres Rauschen anliegt als am Eingang. Dies reduziert wiederum
die Zahl der möglichen Vieldeutigkeiten. Insgesamt ergibt sich jedoch ein
Bild, das ähnlich wie in Abb. 3.12 viele mögliche Perzepte zuläßt, und aus
dem heraus sich noch nicht die Reproduzierbarkeit der Tappzeitpunkte
verstehen läßt.
Die Vieldeutigkeit kann reduziert werden, wenn ein Schwellenprozeß
angenommen wird, der dazu führt, daß ein Detektor nur selten einen von
Null verschiedenen Ausgang erzeugt. So kann man z.B. annehmen, daß der
mit Rauschen stimulierte Detektor zwar grundsätzlich ebenfalls mit
Rauschen antwortet (tiefpaßgefiltert bei z.B. 10 Hz), daß aber ein
nachgeschalteter Schwellenprozeß den Ausgang unterdrückt, wenn er eine
bestimmte Mindestgröße nicht überschreitet. Abb. 3.14 erläutert, wie ein
Schwellenprozeß zu einer Verarmung der möglichen Perzepte führt.
Abb. 3.14: Veranschaulichung eines Schwellenprozesses auf dem Spektrogramm von
Abb. 3.12. Die Übersetzung der Amplituden in Grauwerte wurde für die oberen 30,
15 bzw. 10 dB der vorkommenden Amplituden reskaliert. Es bleiben nur noch
wenige signifikante Stellen übrig. Daß diese nicht den Tappzeitpunkten entsprechen,
darf nicht verwundern, da der unterstellte Schwellenprozeß ja auf dem „inneren“
Spektrogramm ablaufen soll.
Kann so ein Schwellenprozeß die Reproduzierbarkeit des Tappzeitpunktes
erklären? Zunächst kann man einmal die genaue Form des Rauschens (Amplitudenverteilung, z.B. Gaußisch) außer Acht lassen und den Detektor
durch die Wahrscheinlichkeit pD beschreiben, mit der eine Detektion
während einer Sekunde Rauschstimulation ausgelöst wird. Wenn man
annimmt, daß diese Wahrscheinlichkeit sehr klein ist, daß aber die Zahl N
der Detektoren sehr hoch ist, dann ergibt sich eine neue Zahl m=N·pD der
durchschnittlich in einer Sekunde erregten Detektoren. Nun könnte man
annehmen, daß m sehr klein ist, so daß die beobachtete Reproduzierbarkeit
resultiert. Betrachtet man die Daten aus Abb. 3.3, dann würde man auf m  2
schließen.
56
Andererseits kann die Verarmung der potentiellen Merkmale durch einen
Schwellenprozeß nicht erklären, warum praktisch jede Rauschprobe
signifikante Stellen enthält. Bei m  2 müßte es Rauschproben geben, die
zufälligerweise keine Detektion auslösen, und daher homogen wie
nichtperiodisches Rauschen klingen müßten. Die folgende informelle
Beobachtung macht einen weiteren Mechanismus deutlich: Im Anschluß an
Experiment 7, wo die Signifikanz einzelner isolierter Rauschteilstücke
erhoben worden war, wurde versucht, zwei extreme Fälle von periodischem
Rauschen zu erzeugen, a) einen Zyklus aus insignifikanten, und b) einen
Zyklus aus signifikanten Rauschteilstücken. Es wurde erwartet, daß der erste
evtl. gar nicht als periodisch auffällt, während der zweite ein Übermaß an
salienten Merkmalen enthalten müßte. Die so produzierten Stimuli klangen
jedoch ähnlich. Ein geringfügiger Salienzunterschied war feststellbar, aber
auch Rauschen a) ergab eine gute Periodizitätswahrnehmung, während in
Rauschprobe b) etwa ein Element mehr als sonst üblich zu hören war.
Aus dieser Beobachtung wird deutlich, daß es einerseits eine deutlich höhere
Anzahl m von möglichen Perzepten geben muß, daß es aber andererseits zu
einer Interaktion der verschiedenen Merkmale im Sinne einer Konkurrenz
kommt. Salient oder nicht salient sind die Teilstücke nur im Vergleich zu
benachbarten Elementen. Daher wird bei einem aus nicht salienten
Teilstücken zusammengesetzten Zyklus etliches salient, was ansonsten von
dominanteren Elementen überspielt worden wäre. Umgekehrt setzen sich bei
vielen salienten Elementen doch nur drei oder vier durch. Die genauen
Mechanismen der Konkurrenz sind bei der Vielfalt der beteiligten
Detektortypen kaum sicher zu bestimmen. Sie muß jedoch so regelhaft
verlaufen, daß bei einer wiederholten Darbietung derselben Rauschprobe ein
ähnliches Resultat wahrscheinlich ist, und daß verschiedene
Versuchspersonen neben ähnlichen Detektionsmechanismen auch ähnliche
Dominanzen aufweisen.
Man kommt dem Phänomen der Wahrnehmung periodischen Rauschens
nicht mit simplen physikalischen Analysen der dargebotenen Stimuli auf den
Grund. Es ist als Gedächtnisphänomen auf einer zwar frühen, aber doch
schon komplexen sensorischen Verarbeitungsstufe des auditiven Systems
angeordnet, und solange diese ersten Verarbeitungsschritte nicht vollständig
verstanden sind, wäre es illusorisch, aus den Stimuluseigenschaften auf die
Perzepte schließen zu wollen. Die Merkmalsdetektoren auf diesen Stufen
57
sind durch das zufällige Rauschsignal nicht deutlich erregt, sondern
befinden sich in einem nur knapp über der Schwelle liegenden
Erregungszustand. Zwischen diesen schwachen Erregungszuständen kommt
es zu Interaktionen, an deren Ende feststeht, welche sich durchsetzen, und
welche unterdrückt werden. So gesehen ist bei periodischem weißen
Rauschen die Perzeptbildung ein sehr komplexer Vorgang.
In diesem Kapitel wurde der Vorgang der Perzeptbildung bei periodischem
Rauschen näher untersucht. Dabei wurde vorläufig außer acht gelassen, daß
diese Perzepte nicht in normalem, nichtperiodischem Rauschen, sondern nur
bei iterierter Präsentation desselben Rauschsegmentes hörbar werden.
Offensichtlich werden diese Perzepte nur hörbar durch die Beteiligung des
Echogedächtnisses. Dies wird in den folgenden Kapiteln deutlich, wo
typische Gedächtnisparameter wie Lebensdauer und Kapazität des
Echogedächtnisses anhand von periodischem Rauschen erhoben werden.
Die Frage, wie das Echogedächtnis mit den Detektoren zusammenarbeitet,
um die Perzepte in periodischem Rauschen zu erzeugen, wird in Kapitel 6
behandelt.
58
4 Lebensdauer des Echogedächtnisses
Dieses und das nachfolgende Kapitel versuchen, zwei Zeitkonstanten des
auditiven sensorischen Gedächtnisses zu erfassen, die nicht nur
unterschiedliche Werte, sondern auch verschiedene Bedeutung haben. Durch
das genauere Beschreiben der Funktion dieser beiden Zeitkonstanten soll
ihre Rolle beim Erinnern sensorischer Information besser erfaßt werden, um
präzisere Modellvorstellungen zu ermöglichen.
4.1 Lebensdauer: ein typischer Gedächtnisparameter
Seit den berühmten gedächtnispsychologischen Untersuchungen von
Hermann Ebbinghaus (1885) steht bei der Untersuchung von
Gedächtnisphänomenen immer wieder ein Parameter eines Gedächtnisses
im Mittelpunkt: die Lebensdauer. Sie dient der Abgrenzung von
Gedächtnissystemen (z.B. Langzeit–/Kurzzeitgedächtnis), an ihrer
Beeinflussung durch interferierende Störaufgaben wird die Zuständigkeit
des Gedächtnissystems für das Störmaterial abgelesen, und aus der Dynamik
soll der Mechanismus, der für die Speicherung zuständig ist, ablesbar
werden. Dabei ist es eigentlich unpräzise, von einer Konstanten (der
Lebensdauer) zu sprechen, da es sich oft nicht um einfach exponentielle
Abfälle handelt, so z.B. beim Abfall des Ersparnismaßes über die Zeit
(Ebbinghaus, 1885: „Vergessenskurve“). Aber wie die Angabe einer
Schwelle den genauen Verlauf der psychometrischen Funktion verschweigt
und doch oft eine ausreichende Beschreibung liefert, so wird der Abfall der
Gedächtnisleistung über die Zeit meist mit derjenigen Zeit beschrieben, bei
der die Leistung auf die Hälfte gesunken ist.
Das folgende Experiment zur Lebensdauer des Echogedächtnisses
untersucht dementsprechend die naheliegende Fragestellung, bis zu welcher
Zykluslänge periodisches Rauschen noch als periodisch erfaßt werden kann.
Diese Untersuchung ist notwendig zur genauen Erfassung der Rolle der
Lebensdauer des Echogedächtnisses bei der Wahrnehmung periodischen
Rauschens, um sie dann abgrenzen zu können gegen eine andere
Zeitkonstante, die sich bei der in Kapitel 5 geschilderten Untersuchung
ergeben wird.
59
4.2 Experiment 4: Grenze der PR-Detektion für lange
Zyklen
Guttman und Julesz (1963) beschrieben den von ihnen entdeckten Stimulus
als wahrnehmbar bis hin zu Periodenlängen von ein bis zwei Sekunden.
Längere Perioden seien nur mit Training zu erreichen. Warren und Bashford
(1981) beschrieben informelle Beobachtungen, demzufolge ihre beste
Versuchsperson nach langem Training Rauschzyklen bis zu einer Länge von
10 Sekunden wahrnehmen konnte. Eigene informelle Beobachtungen hatten
ergeben, daß es nur sehr wenig Trainings bedarf, um sehr lange
Periodizitäten als solche wahrzunehmen. Das folgende Experiment soll bei
genau quantifiziertem Training festhalten, welche Perioden mit welcher
Wahrscheinlichkeit korrekt detektiert werden. Dabei soll die folgende
Hypothese überprüft werden:
HYPOTHESE:
Die Behaltensleistung des Echogedächtnisses, die die Basis für die PR-Wahrnehmung bildet, hat eine Lebensdauer von mehreren Sekunden. Um diese
Behaltensleistung zu vollbringen, müssen nicht erst besondere Strategien (rehearsal
Strategien o.ä.) erlernt werden, da sie auf dem gewöhnlichen Spurzerfall im
Echogedächtnis beruht. Dies sollte sich empirisch daran erweisen, daß bereits mit
sehr wenig Training PR-Zyklen von mehreren Sekunden Dauer detektiert werden
können.
I. Methodik
A. Versuchspersonen
An dem Experiment wirkten 20 untrainierte Versuchspersonen (11mal
weiblich, 9mal männlich) mit, die noch nie an einem psychoakustischen
Experiment
teilgenommen
hatten.
Es
handelte
sich
um
Psychologiestudenten im zweiten Studienjahr mit (laut Eigenbericht)
normalem Hörvermögen. Sie wurden über das Ziel der Untersuchung in
Kenntnis gesetzt.
B. Stimuli
Das Rauschen wurde mit demselben Algorithmus für Gaußsches weißes
Rauschen wie bei den anderen Experimenten erzeugt (siehe Anhang Anhang
A:). Die Darbietung erfolgte über Sennheiser HD 435 Kopfhörer 60 dB
oberhalb der Schwelle. Für jede Versuchsperson und jeden Einzelversuch
60
wurde ein anderes Rauschen erzeugt, indem der Index des
Zufallszahlenalgorithmus (siehe Anhang A:.A.4) zufällig gewählt wurde.
Die Zykluslängen reichten von 0.5 bis 20 Sekunden (siehe Tab. 4.1).
C. Verfahren
Die Versuchspersonen hörten keinerlei Demonstration von periodischem
Rauschen vorab, sondern begannen sofort mit dem Experiment. Vor jedem
Einzelversuch wurde ihnen auf dem Computermonitor der ungefähre
Bereich der zu erwartenden Periodizität (-10% bis +20% der tatsächlichen
Zykluslänge) angezeigt. Dies sollte ihnen erleichtern, sich auf die richtige
Periodizität zu konzentrieren. Informelle Tests hatten gezeigt, daß es auf
Grund dieser Angabe allein nicht möglich ist, den Rhythmus zu „erraten“
und so korrekt zu tappen, daß die unten beschriebenen Kriterien erfüllt
würden. Die Instruktion an die Versuchspersonen lautete, sie sollten die von
ihnen gehörte Struktur auf der Leertaste der Computertastatur wiedergeben.
Der Zeitpunkt dieses Tappens konnte vom Computerprogramm auf unter
einer Millisekunde genau festgehalten werden. Wenn die Versuchsperson
nicht nach einer gewissen Zeit mit Tappen angefangen hatte (5 Sekunden
plus 7 Zyklen), wurde dieser Einzelversuch als erfolglos gewertet und
abgebrochen. Wenn die Versuchsperson angefangen hatte, den Rhythmus zu
tappen, dann wurde das Rauschen so lange dargeboten, bis sie zu acht
Zyklen getappt hatte. Nach dem Einzelversuch konnte die Versuchsperson
selbst durch Tastendruck den nächsten Einzelversuch starten.
Die Versuchspersonen wurden zufällig einer von zwei Gruppen zu je 10
Versuchspersonen zugeteilt. Gruppe A absolvierte die verschiedenen
Zykluslängen der Tab. 4.1 in aufsteigender Reihenfolge, Gruppe B in
absteigender Reihenfolge. Die Zykluslänge wurde nach jedem Einzelversuch
verändert, unabhängig vom Ausgang des Vorversuchs. Dies könnte mit der
Grenzwertmethode ohne Abbruchskriterium, oder mit der Konstanzmethode
ohne Randomisierung verglichen werden. Alle Versuchspersonen führten
drei solcher Durchläufe („Blöcke“) durch, d.h. sie führten insgesamt zu
jeder Zykluslänge drei Einzelversuche durch.
D. Datenanalyse
Aus den gemessenen Tappzeitpunkten wurde bestimmt, ob die
Versuchsperson die Periode korrekt wiedergegeben hat. Dies wurde zunächst
von einem Computerprogramm automatisch, dann zur Kontrolle auch noch
61
visuell über eine graphische Darbietung der Tappzeitpunkte auf dem
Computermonitor getan. Die Unterschiede zwischen diesen beiden
Vorgehensweisen waren gering. Letztlich wurde den visuell erhobenen
Daten der Vorzug gegeben.
Der Regel des automatischen Algorithmus lautete: mindestens viermal mußte sich
der Tappzeitpunkt eines Zyklus im darauffolgenden Zyklus auf 10% genau
wiederfinden. Für die visuelle Inspektion wurden die Daten auf dem
Computermonitor so dargestellt, daß die horizontale Position den Tappzeitpunkt
modulo der Zykluslänge und die vertikale Position aufeinander folgende Zyklen
repräsentierte. Es ist in dieser Darstellung einfach, an der vertikalen Ausrichtung der
Tappzeitpunkte zu erkennen, ob die Periode korrekt erkannt wurde. Die visuelle
Inspektion wurde eigentlich zu dem Zweck entwickelt, das automatische Verfahren
zu überprüfen. Beide Methoden liefern weitgehend übereinstimmende Ergebnisse: in
1243 von 1320 (94%) der Fälle war das Ergebnis der automatischen Prozedur
dasselbe wie das der visuellen Inspektion. In 51 Fällen war das Ergebnis der
visuellen Inspektion positiv und der automatischen Regel negativ (V+/A-), und in 26
Fällen war es umgekehrt. Die Differenz (51-26=25) gibt den Nettoeffekt des
Unterschieds der beiden Verfahren auf das Ergebnis wieder: er ist von der
Größenordnung von 2%. V-/A+ Urteile kamen in der Regel durch Zufallstappen
zustande, das zufällig die Kriterien der automatischen Regel erfüllte. V+/A- Urteile
kamen oft durch recht genaue harmonische Unterteilungen beim Tappen zustande
(z.B. 2/3), die vom automatischen Algorithmus nicht entdeckt wurden. Alles in allem
ist die visuelle Methode vorzuziehen, da es unmöglich ist, alle Fälle im
Computerprogramm zu berücksichtigen, bei denen eine visuelle Inspektion ein klares
positives Urteil fällen würde. Eine Wiederholung der visuellen Methode nach acht
Monaten ergab in 98% der Fälle dasselbe Ergebnis, mit einem Nettoeffekt von 0.4%.
II. Ergebnisse
In Tab. 4.1 sind die Ergebnisse, summiert über die 10 Versuchspersonen
jeder Gruppe, aufgeführt. Jeweils drei Zeilen geben für jede der beiden
Gruppen die Ergebnisse im ersten, zweiten und dritten Block (Durchlauf)
wieder. In Abb. 4.1 sind dieselben Daten nach Anwendung eines pooladjacent-violators Verfahrens graphisch wiedergegeben. Dabei werden
benachbarte Bins zusammengeworfen, wenn sie eine angenommene
Monotonität verletzen. Das wird solange iteriert, bis eine monotone
Funktion erreicht wird. So werden zufällige Fluktuationen, die das
Beurteilen der Kurven erschweren würden, beseitigt. Dieses Verfahren
wurde auf alle Punkte bis auf den ersten Punkt des ersten Blocks der Gruppe
A angewendet. Die hier beobachtbare Nonmonotonität ist darauf
zurückzuführen, daß dies der erste Einzelversuch des Experiments war, wo
62

I.
.5 .6 .7 .8 1 1.2 1.4 1.6 2 2.4 2.8 3.2 4 5 6 7 8 10 12 14 16 20 [s]


Gruppe A: aufsteigend
B1 5 8 8 9 6 8
B2 8 9 9 9 10 6
8
8
7
6
6
7
5
6
2
5
3 2 3 4 2 1 3 0 0
4 7 3 2 2 3 3 2 3
4 98
1 119
B3 9 8 10 10 9
8
9 10 7
9
7
8 7 6 6 2 4 3 4 3
1 149
9
4
6
Gruppe B: absteigend
B1 8 9 9 10 9
B2 9 9 8 10 9
9
9
9
8
6
9
8
7
5
6
3
8
2
5
6 4 3 1 2 2 2 0 0
7 5 2 3 2 1 1 1 1

0 107
2 122
B3 9 9 7 9 9 9 8 10 8 8 7 6 6 2 3 4 4 3 2 2 1 1 127
Tab. 4.1: Ergebnisse von Experiment 4. Jeder der beiden Gruppen (A und B)
umfaßte 10 Versuchspersonen. In der Tabelle ist aufgeführt, wieviel davon die
Periode korrekt wiedergaben, und zwar im ersten, zweiten, bzw. dritten Block
(B1,B2,B3), als Funktion der Zykluslänge. Gruppe A durchlief die Zykluslängen in
aufsteigender Reihenfolge, Gruppe B in absteigender Reihenfolge. Diese Daten
wurden dann monotonisiert für Abb. 4.1.
die Versuchspersonen noch nicht genau wußten, was sie erwartete. Da dies
aber (für Gruppe A) bei einer leicht durchzuführenden Aufgabe geschah,
wurde dadurch eine Nichtmonotonität eingeführt.
Bevor man ein pool-adjacent-violators Verfahren anwendet, muß man überprüfen,
ob dies gerechtfertigt ist. Eine Vorbedingung ist, daß es gute Gründe gibt,
anzunehmen, daß die Daten sich monoton verhalten. Dies ist bei periodischem
Rauschen der Fall: Guttman und Julesz (1963) haben gezeigt, daß lange Zyklen
schwieriger zu detektieren sind als kurze. Nach Anwendung des Verfahrens sollte
man überprüfen, ob die Originaldaten mit dem Ergebnis kompatibel sind. Dazu
wurde ein ²-Wert berechnet. Dieser gibt den Unterschied zwischen den originalen
Daten (Tab. 4.1) und den geglätteten Daten (Abb. 4.1) wieder. In der Summe über
alle 132 Einträge in Tab. 4.1 ist ² gleich 48.35. Als nächstes muß die Zahl der
Freiheitsgrade bestimmt werden. Im Falle des pool-adjacent-violators Verfahrens
wird bei jedem pooling von p Bins eine Anzahl von p-1 zu der Zahl der
Freiheitsgrade k-1 beigetragen. Summiert über alle durchgeführten pooling Vorgänge
ergibt sich ein k-1 von 62. Für diese hohe Zahl von Freiheitsgraden ist ein ²-Wert
von 48.35 ziemlich klein: ein größerer ²-Wert wäre mit einer Wahrscheinlichkeit
von 70% zu erwarten. Die Abweichungen von der Monotonität in Tab. 4.1 sind daher
gut mit Zufallsfluktuationen zu erklären.
Im ersten Durchlauf von Gruppe A werden noch Zyklen bis 2.8 Sekunden
korrekt getappt. Aber auch Zyklen bis 10 oder 20 Sekunden Länge können
von einigen Versuchspersonen richtig wiedergegeben werden, obwohl das
einzige Training in der Präsentation einiger kürzerer Periodizitäten
63
Abb. 4.1: Graphische Darstellung der Daten aus Tab. 4.1 nach Anwendung eines
pool-adjacent-violators Verfahrens. Die Ordinate zeigt den Prozentsatz der
Gruppe, der die Periodizität korrekt entdeckt hat, die Abszisse gibt die
Zykluslänge wieder. Die durchgezogenen Linien mit Symbolen beziehen sich auf
Gruppe A (aufsteigende Reihenfolge). Es ist ein deutlicher Trainingseffekt
zwischen den einzelnen Durchläufen erkennbar. In Gruppe B (gepunktete Linien)
ist der Trainingseffekt deutlich kleiner.
bestanden hatte (ca. 10 Minuten Gesamtdauer für 10 s, und 20 Minuten für
20 s). Der zweite und der dritte Block zeigen Trainingseffekte: die 50%Schwelle liegt beim zweiten Block bei fünf und beim dritten Block bei
sieben Sekunden.
Die Daten von Gruppe B sind ähnlich. Der Trainingseffekt zwischen den
Blöcken ist deutlich geringer: absteigende Periodizitäten sind als Training
offensichtlich weniger gut geeignet. Um so bemerkenswerter ist es, daß in
dieser Gruppe es zwei Versuchspersonen gelang, zu einem 12-s Zyklus im
ersten Durchlauf korrekt zu tappen. Das einzige Training dieser
Versuchspersonen hatte darin bestanden, vorher (ca. 6 Minuten) noch
längere Zyklen zu hören, bei denen sie keinerlei Periodizität ausmachen
konnten und das ihnen daher wie weißes Rauschen vorkommen mußte.
64
4.3 PR-Wahrnehmung: ein Phänomen des langen
auditiven Speichers
Guttman und Julesz (1963) geben als Grenze der Detektion von
periodischem Rauschen durch naive Versuchspersonen eine bis zwei
Sekunden an. Dies erweist sich ganz im Sinne der eingangs aufgestellten
Hypothese mit ganz geringem Aufwand auf mehrere Sekunden ausdehnbar.
Es handelt sich offensichtlich nicht um eine wirkliche Grenze, da die
Versuchspersonen bei Guttman und Julesz zwar einerseits um das Paradigma
wußten, andererseits nicht mit Konzentration einige Minuten Versuchszeit
investierten. Es wäre interessant, ein Paradigma zu entwerfen, mit dem für
naive, nicht informierte und nicht aufmerksam auf das Rauschen achtende
Versuchspersonen erhoben wird, bis zu welcher Grenze sie spontan einen
Unterschied zwischen nicht periodischem und periodischem Rauschen
entdecken. Dies könnte dann wesentlich näher bei 250 ms (der von Guttman
und Julesz gefundenen Grenze zwischen motorboating und whooshing
Perzepten) liegen, und damit auch in der Größenordnung der im nächsten
Kapitel abzuleitenden Zeitkonstanten für die Kapazität des
Echogedächtnisses.
Durch Experiment 4 ist klar geworden, daß informierte und aufmerksame
Versuchspersonen mit ganz geringem Trainingsaufwand Zyklen von bis zu
sieben Sekunden Länge entdecken können. Zeitkonstanten dieser Größe
ordnet Nelson Cowan (1984) dem langen auditiven Speicher zu. Daher soll
verglichen werden, inwieweit das Phänomen des periodischen Rauschens
auf der Grundlage der bisher erhobenen Daten mit dem von Cowan
postulierten Speichersystem kompatibel ist.
Ein Kennzeichen von Phänomenen des langen auditiven Speichers ist nach
Cowan, daß diese Phänomene subjektiv als Erinnern erfahren werden. Dies
gilt nicht für periodisches Rauschen: Das erste Vorkommen eines Perzeptes
wird nicht als Erinnern, sondern als Wahrnehmung erfahren. In weiteren
Zyklen wiederholen sich dann diese Perzepte, und nun kann dies in der
Erinnerung mit den früheren Zyklen verglichen werden. Aber hier ist – wie
beim erstmaligen Hörbarwerden – das Echogedächtnis für die Wahrnehmung
zuständig. Das Erinnern des Wahrgenommenen kommt hinzu und ist nicht
ursächlich.
65
Diese Besonderheit von periodischem Rauschen liegt an der unstrukturierten
Art des Stimulus, die den Anstoß zu seiner Verwendung in der
Echogedächtnisforschung gegeben hat. Sobald strukturiertere Stimuli zur
Anwendung kommen, wird bereits deren erstes Vorkommen bewußt
erfahren und kann mit einem späteren Vorkommen verglichen werden. Mit
weißem Rauschen haben wir uns an ein Extrem der Verarbeitungskette
gestellt, wo Gedächtnisphänomene zwar schon nachweisbar sind, aber nicht
bewußt erfahren werden. Dies muß keinen wesentlichen Unterschied
ausmachen. So gibt es fließende Übergänge, wie z.B. bei Experimenten zum
Zeitordnungsgedächtnis: Bei ganz schnellen Abfolgen können Änderungen
der Reihenfolge zwar detektiert werden, die korrekte Reihenfolge kann aber
nicht reproduziert werden. Es wäre zu fragen, ob hier von einem bewußten
Erinnern im Sinne von Cowan gesprochen werden kann, da die Tonfolge als
solche zwar gut hörbar ist, die Abfolge der Töne aber nicht aufgelöst werden
kann. In Abweichung von dem von Cowan benannten Kennzeichen
erscheint es sinnvoll, auch solche Phänomene dem langen auditiven
Speicher zuzuordnen, die nicht bewußt als Erinnern erfahren werden.
Umgekehrt ist es sicherlich weiterhin sinnvoll, als Kennzeichen des kurzen
auditiven Speichers das Fehlen der Erfahrung einer Erinnerung
beizubehalten.
Die hier gemessenen maximalen Zyklusdauern sind etwas geringer als die
von Cowan für den langen auditiven Speicher angenommene Zeitkonstante
(20 s). Aber auch Cowan hat viele Phänomene mit ähnlichen Zeitkonstanten
beim langen auditiven Speicher eingeordnet. Er erklärt diese Diskrepanz mit
einer Störung des Gedächtnismechanismus durch zwischenzeitlich
präsentiertes Stimulusmaterial. Auch bei periodischem Rauschen wäre eine
solche Erklärung möglich. Cowan hatte schon die 1-2 s Grenze von
Guttman und Julesz in die Klasse der Phänomene des langen auditiven
Speichers eingeordnet. Von daher bedeutet es einen großen Fortschritt, daß
mit der vorliegenden Arbeit nachgewiesen wird, daß diese Grenze mit nur
wenig
Training
auf
5-7
Sekunden
erweiterbar
ist.
Die
größenordnungsmäßige Übereinstimmung der hier abgeleiteten Konstante
mit der von Cowan postulierten Zeitkonstante des langen auditiven
Speichers ist ausreichend, um die PR-Wahrnehmung in die Klasse der
Phänomene des langen auditiven Speichers einordnen zu können.
66
Wie schon am Anfang dieses Kapitels bemerkt, ist es problematisch, den
Abfall der Gedächtnisleistung mit einer einzigen Zahl zu beschreiben. Der
Verlauf der in Abb. 4.1 gezeigten Kurven ist signifikant von einem
exponentiellen Abfall verschieden und erinnert eher an s-förmige Verläufe
wie bei Funktionen aus der Klasse der tanh. Solche Kurven kommen in
quantitativen Modellen des Gedächtnisses dann zustande, wenn neben
Zerfallsprozessen auch Selbsterregungs– und Sättigungsprozesse
berücksichtigt werden. Altmann (1997) untersucht einen autokatalytischen
Selbsterregungsprozeß mit zeitverzögerter Hemmung nach Vorschlägen von
Geißler (1995) und kann damit psychophysisch gemessene Verläufe für das
Blochsche Gesetz, die Helligkeitsskalierung nach Brocca und Sulzer, die
Maskierung eines Lichtblitzes durch einen großflächigeren, zeitversetzten
Maskierungsreiz nach Sperling und die Scheinbewegung nach Kolers im
Modell replizieren. Es erscheint allerdings schwierig, auf Grund der in
Experiment 4 erhobenen Daten einen Schluß auf ein zugrundeliegendes
Modell zu versuchen, da die gemessenen Prozentsätze (wie viele
Versuchspersonen der Gruppe haben die Aufgabe lösen können?) mit der
Aktivierung der Gedächtnisspur nicht in einem einfach auflösbaren
Zusammenhang stehen. Der Verlauf der Kurven in Abb. 4.1 würde sich
außerdem wahrscheinlich ändern, wenn man andere Abbruchskriterien (statt
der „5 Sekunden plus 7 Zyklen“) wählen würde.
67
68
5 Kapazität des Echogedächtnisses
In diesem Kapitel wird untersucht, wieviel von dem Rauschen bei einer
Darbietung periodischen Rauschens sich tatsächlich erinnern läßt. Erfaßt
man dies in einer zeitlichen Meßeinheit, so ergibt sich eine erstaunlich
kleine Zahl, die Anlaß zur Definition einer neuen Zeitkonstanten für das
Echogedächtnis gibt: der Kapazität. In Abschnitt 5.1 wird diese Größe
zunächst theoretisch diskutiert, in Abschnitt 5.2 werden Grundidee und
Methodik der folgenden Experimente besprochen, die dann in den
Abschnitten 5.3 und 5.4 beschrieben werden. In Abschnitt 5.5 werden die
Ergebnisse dieser beiden Experimente zusammengefaßt und die möglichen
theoretischen Implikationen diskutiert.
5.1 Kapazität: eine Zeitkonstante?
In der Gedächtnisforschung dient neben der Messung der Lebensdauer
immer auch die Messung des Fassungsvermögens eines Gedächtnissystems,
der Kapazität, zur Charakterisierung und Abgrenzung verschiedener
Systeme voneinander. Berühmt ist die Arbeit von Miller (1956), in der viele
relevante Arbeiten besprochen werden und die Kapazität des
Kurzzeitgedächtnisses mit sieben plus minus zwei Einheiten (items)
abgeschätzt wurde. Lediglich beim Langzeitgedächtnis gibt es solche
Untersuchungen nicht, da man davon ausgeht, daß hier die Kapazität so groß
ist, daß sie nicht experimentell erfaßt werden kann.
Die Kapazität eines Gedächtnissystems wird in der Regel in Einheiten des
zu lernenden Materials, z.B. als Anzahl der behaltbaren Ziffern oder
sinnlosen Silben angegeben. Dabei stellt man fest, daß die Kapazität des
Kurzzeitgedächtnisses von der Art des zu behaltenden Materials abhängt. So
können z.B. wesentlich weniger sinnlose Silben als Ziffern gemerkt werden.
Es liegt nahe, zu vermuten, daß dieses Gedächtnissystem zwar schon eine
einheitliche Kapazität hat, daß aber je nach Material unterschiedlich viel pro
Einheit davon verbraucht wird. Dies könnte daran liegen, daß ein
kategorialer Kode abgespeichert wird, und daß die einzelnen Einheiten in
diesen Kode übersetzt unterschiedlich viel Kode ergeben. In Analogie zur
automatischen Datenverarbeitung könnte man davon sprechen, daß eine
einzelne Einheit je nach Material unterschiedlich viele Bits an Information
69
zur Kodierung braucht, und daß die Kapazität des Kurzzeitgedächtnisses,
gemessen in Bits, konstant ist. Das Problem liegt darin, daß man den zur
Speicherung verwendeten Kode nicht kennt und daher die Kapazität nicht in
diesem Maß ausdrücken kann. Daher muß man auf operational definierte
Maße, wie z.B. die Anzahl der Einheiten, zurückgreifen.
Wenn man sich dem sensorischen Gedächtnis zuwendet, stößt man beim
Versuch, die Kapazität in Anzahl der Einheiten zu messen, auf
Schwierigkeiten. Wie viele Einheiten ist „eine Sekunde weißes Rauschen“?
Beim klassischen Versuch von George Sperling (1960) zum visuellen
sensorischen Gedächtnis wurde zwar eine Matrix mit einer abzählbaren
Anzahl von Buchstaben dargeboten, aber da das Konzept des ikonischen
Gedächtnisses von Neisser (1967) eine äußerst hohe Kapazität der Ikone
vorsah, kann man diese nicht mit der Zahl der Buchstaben in
Zusammenhang bringen. Es ist zudem so, daß man im Teilbericht nicht nur
den Buchstaben, sondern auch seine Größe, seine Farbe, ja evtl. ob er
Serifen hat, berichten könnte. Mit dem visuellen sensorischen Speicher ist es
möglich, Zufallspunktemuster zu erinnern (z.B. Eriksen und Collins, 1967),
wo die Anzahl der Einheiten (wenn man in dieser Maßzahl messen will)
sehr hoch ist. Das Einprägen der Buchstabenmatrix im Fall von Sperling ist
nicht vergleichbar mit Experimenten zum Kurzzeitgedächtnis, wo in der
Regel nur der Buchstabenwert, also seine Bedeutung, erinnert wird. Zu
diesem Zweck erfolgt hier eine Transformation in kategoriale Kodes, die
(ebenfalls ein Postulat Neissers) bei der Ikone noch nicht stattgefunden hat.
Es ist daher nicht einfach, auf die Frage der Kapazität der Ikone eine
Antwort zu geben, ja es ist noch nicht einmal klar, in welcher Einheit
(Steradian? Pixel?) diese Antwort ausfallen müßte.
Beim auditiven sensorischen Gedächtnis bietet es sich an, diejenige Menge
weißen Rauschens zu bestimmen, die im Echogedächtnis gespeichert
werden kann. Als Maß dafür kommt die Zeitdauer dieser Menge weißen
Rauschens in Frage. Natürlich würden sich für anderes, redundanteres
Stimulusmaterial andere Werte ergeben, aber da unser Ansatz war, sich ganz
an das eine Extrem der Signalverarbeitungskette zu stellen, ist mit der
Angabe der Kapazität in Millisekunden weißen Rauschens eine sinnvolle
Eckgröße für die Kapazität des Echogedächtnisses ermittelt.
Welche Größe könnte man für die so zu ermittelnde Kapazität vermuten? In
vielen Abhandlungen über periodisches Rauschen wird angegeben, daß das
70
Echogedächtnis 1 Sekunde weißes Rauschen speichern könne. Dies
orientiert sich sicherlich an der ursprünglich von Guttman und Julesz
angegebenen Grenze von 1-2 Sekunden für die maximale Zykluslänge. Da
sich diese Grenze sehr leicht auf mehrere Sekunden erweitern läßt, müßte
man analogerweise vermuten, daß die Versuchsperson sehr leicht lernt,
mehrere Sekunden weißes Rauschen im Echogedächtnis zu speichern. Beim
Verfolgen langer Periodizitäten wie in Experiment 4 fällt jedoch introspektiv
auf, daß man lediglich einen ganz kleinen Teil des Rauschzyklus strukturiert
erlebt, während der Rest des Zyklus wie ganz normales weißes Rauschen
klingt. Dies war die Motivation für die folgende Untersuchung. Der nächste
Abschnitt bespricht, wie die Kapazität des Echogedächtnisses mit Hilfe der
PR-Wahrnehmung ermittelt werden kann. Mit der vorgestellten Methodik
wird dann in Abschnitt 5.3 und 5.4 die folgende Hypothese überprüft:
HYPOTHESE:
Die Kapazität des Echogedächtnisses für weißes Rauschen ist äußerst gering. Drückt
man sie als Zeitmaß aus („Wie viele Millisekunden weißes Rauschen können erinnert
werden?“), dann ist sie um eine Größenordnung kleiner als die Lebensdauer des
Echogedächtnisses. Empirisch sollte sich finden lassen, daß bei der PRWahrnehmung große Teile des Zyklus ausgetauscht werden können, ohne daß dies
der Versuchsperson auffällt.
5.2 Austausch von Segmenten zur Kapazitätsmessung
Um auszumessen, wieviel von dem Rauschen während einer PR-Darbietung
wirklich erinnert wird, wurden während der Darbietung Teile des Zyklus
ausgetauscht und der Versuchsperson die Aufgabe gestellt, anzuzeigen, wann
immer sie einen solchen Wechsel bemerkt. In Vorversuchen stellte sich
heraus, daß man dabei keine längeren Teilstücke am Stück austauschen
sollte, da man damit nicht erfassen kann, wenn z.B. zwei Elemente gemerkt
werden, zwischen denen eine nicht erinnerte Lücke ist. Wenn die Teilstücke
länger als diese Lücke sind, ist sie nicht meßbar, und würde fälschlich der
erinnerten Menge zugeschlagen. Wenn man hingegen nur ein kurzes Stück
austauscht, ist die Wahrscheinlichkeit sehr hoch, daß dieser Austausch nicht
bemerkt wird, und man muß sehr viele Versuche machen, bevor man anhand
positiver Reaktionen der Versuchsperson weiß, welche Teilstücke relevant
sind. In den folgenden Experimenten wurden daher jeweils mehrere kleine
Teilstücke an unabhängigen Stellen ausgetauscht, und die Anzahl dieser
Teilstücke wurde adaptiv so geregelt, daß in 50% der Fälle der Austausch
71
ein Einzelversuch
Zwischenzyklus nächster Einzelversuch
CDE FABC x E y ABCDE FABCDE F A z CDE FABC
Testzyklus
intakter Zyklus
Antwortintervall
Abb. 5.1: Aufbau eines Einzelversuchs für Experimente 5 und 6. Der Zyklus sei in
eine Anzahl von (hier: sechs) Segmenten unterteilt. Ein Einzelversuch besteht aus
einem veränderten Zyklus (hier: zwei Segmente ausgetauscht) und einem darauf
folgenden intakten Zyklus. Zwischen je zwei Einzelversuchen liegt noch ein
weiterer Zwischenzyklus, damit die Versuchsperson sich besser an den intakten
Zyklus gewöhnen kann.
bemerkt wurde. Abb. 5.1 erläutert den Aufbau eines Einzelversuchs, wie sie
in Experiment 5 und 6 zum Einsatz kamen.
Ein Einzelversuch begann damit, daß mitten in der Darbietung periodischen
Rauschens ein Zyklus durch den Austausch einer gewissen Zahl von
Segmenten verändert wurde. Diesem veränderten Zyklus folgte ein intakter
Zyklus, und die Versuchsperson hatte mit ihrer Antwort Zeit, bis dieser
intakte Zyklus vorbei war. So konnte sie nach dem veränderten Zyklus noch
einmal den intakten Zyklus abwarten, bevor sie sich zu der Mitteilung
entschied, tatsächlich eine Veränderung wahrgenommen zu haben. Bevor
dann der nächste Einzelversuch begann, wurde ein weiterer intakter
Zwischenzyklus eingeschoben, um die gedächtnismäßige Repräsentation des
erinnerten Rauschsegmentes aufzufrischen bzw. zu festigen. Somit war also
jeder dritte Zyklus der Beginn eines Einzelversuchs, und der Versuchsperson
wurde dieser Beginn am Computermonitor angezeigt.
Wenn die Versuchsperson eine Veränderung gehört zu haben meinte,
signalisierte sie das durch einen Tastendruck auf der Leertaste der
Computertastatur. Diese Reaktion wird im folgenden als Ja-Reaktion
bezeichnet, während keine Reaktion (keine Taste gedrückt) als NeinReaktion bezeichnet wird. Bei einer Ja-Reaktion wurde die Zahl der
auszutauschenden Elemente beim nächsten Einzelversuch um eins reduziert
(wie in Abb. 5.1: statt zweier Elemente wird im nächsten Einzelversuch nur
noch ein Element ausgetauscht), bei einer Nein-Reaktion wurde sie um eins
erhöht. Dadurch wird gewährleistet, daß der Anteil der Ja-Antworten
ungefähr 50% ausmacht. Dies ist für die maximum-likelihood Auswertung
von Vorteil. Mit einer Wahrscheinlichkeit von 20% wurde ein
Kontrollversuch eingeführt, bei dem kein Element ausgetauscht wurde. Eine
Ja-Antwort auf einen Kontrollversuch wurde als falscher Alarm gewertet.
72
Waren im gesamten Versuch (60 Einzelversuche) mehr als 2 falsche Alarme,
dann wurde der Versuch als ungültig bewertet und mußte wiederholt werden.
Dies sollte ein strenges Entscheidungskriterium induzieren, bei dem nur
dann eine Veränderung angezeigt wurde, wenn sie mit großer Sicherheit
wahrgenommen wurde, da eine hohe Falsch-Alarm-Rate die Ergebnisse des
maximum-likelihood Verfahrens in Frage gestellt hätte.
Zusätzlich wurde vor und nach dieser Phase zu dem selben periodischen
Rauschen mittels Tappen erhoben, wann die Versuchsperson die für sie
relevanten Perzepte hört. Ein kompletter Versuch begann also mit einer
Darbietung periodischen Rauschens, zu der die Versuchsperson nach einer
gewissen Zeit des Zuhörens den von ihr gehörten Rhythmus mit Tappen
anzeigen sollte. Es war erlaubt, auch mehrmals pro Periode zu tappen, wenn
mehrere Elemente hörbar wurden. Wenn die Versuchsperson zu 10 Zyklen
dieses Rauschens mitgetappt hatte, wurde bei fortlaufender Darbietung die
Aufgabe geändert, und sie mußte nun Veränderungen wie in Abb. 5.1
beschrieben detektieren. Waren 60 solcher Einzelversuche vorbei, dann
mußte sie noch einmal den von ihr gehörten Rhythmus tappen. Ein solcher
Versuch konnte für die längste getestete Periode (6 Sekunden) 20 Minuten
dauern.
Die Log-Datei eines Versuchs konnte dann aussehen wie in Tab. 5.1 für
Beispielsdaten. Am Anfang und am Ende findet man die Zeiten, zu denen
die Versuchsperson den von ihr gehörten Rhythmus getappt hat. Da es sich
hier um einen sechs Sekunden langen Zyklus handelte, werden in der
rechten Kommentarspalte diese Zeiten modulo sechs dargestellt. Daraus
geht hervor, daß die Versuchsperson am Anfang zu zwei Zeitpunkten im
Zyklus tappt, ungefähr bei 4.0 und 5.8, und am Ende des gesamten Versuchs
zu einem Zeitpunkt, bei 4.0. Dazwischen liegen die Beschreibungen der
Einzelversuche. Diese beginnen mit der Zahl der ausgetauschten Segmente
(erste Zeile: 5 Segmente wurden ausgetauscht) und der Antwort der
Versuchsperson („j“ für Ja und „n“ für Nein, erste Zeile: Ja, also der
Wechsel wurde bemerkt). Dann folgen die Kennzahlen derjenigen
Segmente, die ausgetauscht worden waren (erste Zeile: 0,1,3,11,14). In der
nächsten Zeile werden nur noch vier Segmente ausgetauscht, da im
Vorversuch eine Ja-Reaktion erfolgte. In der vierten Zeile ist ein
Kontrollversuch wiedergegeben, den die Versuchsperson korrekt
zurückgewiesen hat. Die Kommentare zu den Einzelversuchen in der
73
rechten Spalte beziehen sich auf das maximum-likelihood Verfahren, das im
folgenden beschrieben wird.
Nehmen wir an, jedes Segment i sei gekennzeichnet durch eine gewisse
Wahrscheinlichkeit pi, daß der Austausch dieses Segmentes bemerkt wird,
wenn sonst nichts an dem Rauschzyklus geändert wird. Dies war natürlich
normalerweise nicht der Fall, da ja mehrere Segmente ausgetauscht wurden.
Die Wahrscheinlichkeit, den Austausch dieses einen Segmentes zu
verpassen, ist dann 1  pi. Die Wahrscheinlichkeit, einen Austausch
mehrerer Segmente im Einzelversuch t zu verpassen, ist dann
Gl. 5.1:
pt(„Nein“) = i=a,b,c...(1  pi),
wobei a,b,c... die Kennzahlen der in Einzelversuch t ausgetauschten
Segmente sind. Die Wahrscheinlichkeit pt(„Ja“), den Austausch zu
bemerken, ist dann 1  pt(„Nein“). Somit kann für jeden Einzelversuch t die
Wahrscheinlichkeit für die tatsächlich beobachtete Antwort („Ja“ oder
„Nein“) berechnet werden. Dies ist in der rechten Spalte von Tab. 5.1 neben
jedem Einzelversuch demonstriert.
Es ist das Ziel der maximum-likelihood Analyse, die einzelnen
Wahrscheinlichkeiten pi von der Antwort der Versuchsperson auf
Multisegmentaustausche abzuleiten, also den Beitrag der pi aus der
Entdeckungswahrscheinlichkeit für eine Austausch mehrerer Segmente
herauszulösen. Dazu wurden die pi zunächst auf Zufallswerte gesetzt. Für
jeden Einzelversuch t eines bestimmten Versuches konnte nun für diese
hypothetischen pi die Wahrscheinlichkeit pt(„Ja“) oder pt(„Nein“) für die
beobachtete Antwort in diesem Einzelversuch berechnet werden. Das
Produkt aller dieser Wahrscheinlichkeiten ist gleich der Wahrscheinlichkeit
ps für den ganzen Versuch aus 60 Einzelversuchen. Diese
Wahrscheinlichkeit ps hängt natürlich von den gewählten Werten der pi ab,
und diese sind ja noch nicht sinnvoll, sondern erst einmal zufällig. Indem
man nun die Werte der pi variiert, kann die Wahrscheinlichkeit ps optimiert
werden. Diejenigen Werte für die pi, die den optimalen Wert für ps liefern,
werden dann als wahrscheinlichste Werte für die pi akzeptiert.
Die Optimierungsmethode konvergiert für verschiedene Startwerte immer
gegen dieselben Werte der pi. Diese werden als Anzeichen für die Relevanz
dieses Elementes für die Gedächtnisaufgabe angesehen. Die Summe  pi  S
74
der Wahrscheinlichkeiten pi multipliziert mit der Segmentlänge S hat die
Einheit Sekunden und ist ein Maß für die Kapazität des insgesamt erinnerten
weißen Rauschens. Dieses Maß verändert sich nicht, wenn die
Versuchsperson während des Versuchs ihre Strategie ändert und andere
Segmente erinnert: die pi der alten Segmente werden abnehmen, und dafür
werden an anderer Stelle die pi zunehmen, und die Summe bleibt gleich.
Auszug aus Log-Datei
...
Tapp bei 124.20
Tapp bei 125.81
Tapp bei 129.87
Tapp bei 131.87
Tapp bei 135.91
Tapp bei 137.81
...
5
4
5
0
6
5
6
...
y
n
n
n
y
n
n
0
6
3
0
2
2
Kommentare
Tappzeitpunkt modulo 6 Sekunden
4.20
5.81
3.87
5.87
3.91
5.81
Wahrscheinlichk. pt für Resultat von Einzelversuch t
pt(„ja“) = 1- (1-p0)(1-p1)(1-p3)(1-p11)(1-p14)
pt(„nein“) =
(1-p6)(1-p8)(1-p10)(1-p11)
pt(„nein“) =
(1-p3)(1-p5)(1-p14)(1-p15)(1-p19)
Kontrollversuch, korrekt zurückgewiesen
1 4 11 15 18 pt(„ja“) = 1- (1-p0)(1-p1)(1-p4)(1-p11)(1-p15)(1-p18)
9 11 17 18
pt(„nein“) =
(1-p2)(1-p9)(1-p11)(1-p17)(1-p18)
3 4 5 7 17 pt(„nein“) =
(1-p2)(1-p3)(1-p4)(1-p5)(1-p7)(1-p17)
ps =  pt
1 3 11 14
8 10 11
5 14 15 19
...
Tappzeitpunkt modulo 6 Sekunden
Tapp bei 1222.04
4.04
Tapp bei 1228.12
4.12
Tapp bei 1234.03
4.03
Tapp bei 1239.96
3.96
Tapp bei 1245.97
3.97
Tab. 5.1: Auszug aus einer beispielhaften Log-Datei für Experiment 5 oder 6.
Erläuterungen siehe Text.
In Simulationen wurde nachgewiesen, daß die durch die maximumlikelihood Abschätzung der pi eingeführten Fehler gering sind: 13% für die
pi bzw. zwischen 12 und 19% für die Summe.
Um den durch das maximum-likelihood Verfahren eingeführten Fehler abzuschätzen,
wurden Simulationen mit „virtuellen Versuchspersonen“ durchgeführt. Die in
Experiment 5 ermittelten Werte für die pi wurden für diese virtuellen
Versuchspersonen als tatsächlich gegeben angenommen. Deren Reaktion sollte nur
von diesen pi abhängen wie in Gl. 5.1 beschrieben. 5800 virtuelle Einzelversuche
75
wurden durchgeführt (100mal jeder gemessene Satz von p i). Jede Sitzung hatte 48
Einzelversuche (60 minus 20% Kontrollversuche), und es wurde die Abweichung der
mittels maximum-likelihood Verfahren errechneten Schätzwerte qi von den als
wirklich gegeben angenommenen pi ermittelt. Die Standardabweichung für die
einzelnen qi war im Mittel 13%. Wären die Fehler der qi voneinander unabhängig,
dann müßte der Fehler der Summe  pi  S gleich 0.13  S  B sein, wo B die Anzahl
der Segmente im Rauschzyklus ist. Der tatsächlich gemessene Fehler für die Summe
beträgt 12% für die kürzesten verwendeten Zykluslängen und 19% für die längsten.
Er ist deutlich kleiner als 0.13  S  B und entspricht ungefähr 0.13  S  Bnn, wo
Bnn die mittlere Anzahl der von Null verschiedenen Segmente ist. Der Fehler der
Summe wird weiterhin ungefähr um einen Faktor 4 reduziert durch den Umstand,
daß insgesamt ca. 16 Messungen pro Zykluslänge durchgeführt wurden. Er macht
somit ca. 5% bei den Daten von Experiment 5 und 6 aus.
In den folgenden beiden Experimenten wurde überprüft, wie das so
erhaltene Kapazitätsmaß sich in Funktion der Zykluslänge (Experiment 5)
bzw. der Segmentlänge (Experiment 6) verhält.
5.3 Experiment 5: Abhängigkeit von der Zykluslänge
I. Methodik
Fünf untrainierte Versuchspersonen lernten mit einer kurzen
Trainingsprozedur, in 6-s langen Zyklen die Periodizität wahrzunehmen.
Dazu wurde ihnen leicht wahrnehmbares periodisches Rauschen einer Zykluslänge
von 0.6 Sekunden vorgespielt. Sie wurden aufgefordert, den gehörten Rhythmus
mitzutappen. Mit jedem Tapp der Versuchsperson verlängerte sich der Zyklus um ein
kleines Stück. Wenn sich dadurch das Perzept zu sehr änderte, durfte die
Versuchsperson mit Tappen aufhören und noch einmal genau hinhören, um evtl.
einen anderen Tappzeitpunkt zu wählen. Wenn die Versuchsperson nicht innerhalb
von 10 Zyklen wieder mit Tappen startete, wurde der Versuch abgebrochen. Wenn
das Programm die Länge von sechs Sekunden erreicht hatte, wurden noch weitere 10
Zyklen präsentiert, dann war ein Trainingslauf (ca. 3 Minuten) beendet. Mittels
visueller Inspektion einer graphischen Darstellung der Tappzeitpunkte wurde
kontrolliert, ob die Versuchsperson tatsächlich erfolgreich bis zum Schluß den
Rhythmus gehört hatte. Vier erfolgreich abgeschlossene Trainingsdurchläufe waren
Voraussetzung für den Start des Experimentes.
Die Stimuli wurden auf einer NeXT workstation erzeugt und mit 44.1 kHz
gewandelt. Es kam die im vorigen Abschnitt beschriebene Methodik des
Austauschs von Segmenten zur Anwendung. Die Segmentlänge sollte nicht
kürzer als die in Experiment 2 abgeschätzten 100 ms sein, und nicht so groß,
76
daß nicht erinnerte Lücken zwischen zwei Segmenten nicht mehr ausgetastet
werden können. Sie wurde für dieses Experiment auf 300 ms gesetzt. Als
Zykluslängen kamen 1.2, 2.4, 4.2 und 6 Sekunden zum Einsatz, das
bedeutet, daß die Zyklen in 4, 8, 14, bzw. 20 Segmente unterteilt wurden.
Für jeden Versuch (der 60 Einzelversuche enthielt) wurde eine neue
Rauschprobe der benötigten Länge gewürfelt. Wenn eine Versuchsperson
mit einem Stimulus nicht zurechtkam, also keine deutliche Periodizität
heraushören konnte, dann durfte sie den Versuch abbrechen und einen neuen
Stimulus würfeln lassen. Diese Möglichkeit wurde von den
Versuchspersonen begrüßt und in etwa 1/3 aller Fälle in Anspruch
genommen. Die Versuchspersonen sollten die verschiedenen Zykluslängen
in aufsteigender Reihenfolge dreimal durchführen, was eine Summe von 60
Versuchen ergibt. Die Studenten haben sich nicht ganz an diesen Plan
gehalten und insgesamt 58 valide Datensätze erzeugt (1.2s: 17, 2.4s: 15,
4.2s:14, 6s:12).
II. Ergebnisse
Der größte Teil von langen Zyklen konnte ausgetauscht werden, ohne daß
die Versuchspersonen es bemerkt hätten: 2/3 aller pi waren gleich Null. Die
relevanten Segmente (pi > 0.5) waren in der Regel an denselben Stellen, an
denen die Versuchspersonen auch getappt hatten. In der Hälfte der Fälle war
das Tappen vor und nach den Einzelversuchen identisch. Abb. 5.2 zeigt für
einen der 58 Datensätze das Ergebnis der Einzelauswertung.
Abb. 5.3 zeigt die Ergebnisse gemittelt über die fünf Versuchspersonen als
Funktion der Zykluslänge. Die Fehlerbalken zeigen die Größe der Standardabweichung der Daten an. Die Hauptquelle der Varianz ist die
interindividuelle Variabilität. Wenn die Versuchspersonen 100% des
Rauschzyklus erinnert hätten, müßten die Daten auf der Diagonalen liegen.
In Wirklichkeit aber haben die Versuchspersonen nur einen kleinen Teil der
Rauschprobe erinnern können, und zwar unabhängig von der Zykluslänge
ca. eine halbe Sekunde.
Das so gewonnene Ergebnis kann aber noch nicht als valider Schätzwert der
Kapazität des Echogedächtnisses für weißes Rauschen gesehen werden.
Wenn die Versuchspersonen sich z.B. nur einen unendlich kleinen Bruchteil
der Wellenform gemerkt hätten, diesen aber perfekt, dann hätten sie immer
den Austausch eines ganzen 300 ms langen Segmentes entdeckt, und als
77
Versuchsperson AS, Versuch
16.
 pi  S = 0.534 Sekunden.
Segmentposition im Rauschzyklus [s]
Abb. 5.2: Beispiel für das Ergebnis der maximum-likelihood Analyse. Die
x-Achse repräsentiert den 6-s Rauschzyklus und ist wie dieser in 20
Segmente unterteilt. Die y-Achse gibt die Werte für die
Wahrscheinlichkeit pi wieder, daß das Segment bei Austausch eine JaReaktion auslöst (graue Balken). Die meisten pi sind gleich Null, d.h.
diese Segmente hätten unbemerkt ausgetauscht werden können. Die
Fehlerbalken wurden mit einer Simulationsmethode bestimmt (siehe
Abschnitt 5.2). Die vor und nach den 60 Einzelversuchen erhobenen
Tappzeitpunkte sind durch die obere bzw. untere Gruppe von schwarzen
Punkten dargestellt. Dabei wurde die y-Koordinate willkürlich so
gewählt, daß die Punkte nicht aufeinander fallen. In diesem Versuch hat
die Versuchsperson ihr Tappverhalten (zwei kurz aufeinander folgende
Tapps pro Periode) am Ende (20 Minuten später) reproduziert. Die
Tappzeitpunkte und die Relevanz der Segmente (d.h. die pi) stimmen in
diesem Versuch überein.
Schätzwert hätten wir 300 ms erhalten. In Experiment 6 wird daher die
Segmentlänge variiert und überprüft, wie die gemessene Kapazität davon
abhängt.
78
Zykluslänge des periodischen Rauschens [s]
Abb. 5.3: Ergebnis von Experiment 5. Erinnerter Teil eines Zyklus weißen
Rauschens, gemittelt über fünf Versuchspersonen, als Funktion der Zykluslänge. Die
Segmentlänge betrug 300 ms. Die Fehlerbalken entsprechen der
Standardabweichung der Daten. Es ergibt sich unabhängig von der Zykluslänge ein
Wert von ungefähr 500 ms.
5.4 Experiment 6: Abhängigkeit von der Segmentlänge
Wir wollen eine einfache Beziehung zwischen der tatsächlichen Kapazität
des Echogedächtnisses und dem mit der beschriebenen Methode des
Austauschs von Segmenten erhaltenen Maß M ableiten und nehmen dazu
ein einfaches Modell des Speicher- und Vergleichprozesses an. Die
Versuchsperson sei in der Lage, ein kohärentes Stück der Länge  zu
erinnern (siehe Abb. 5.4). Ein kleiner, auch nur partieller Austausch von
diesem Segment führe mit Sicherheit zur Ja-Reaktion, jeder andere
Austausch bleibe unbemerkt.
Wenn  kleiner ist als die Segmentlänge S, dann kann das Stück der Länge 
entweder ganz in ein Segment fallen (Fall a von Abb. 5.4), und das Ergebnis
wäre M=S. Oder es überschreitet eine Segmentgrenze, so daß der Austausch
von jedem dieser beiden Segmente entdeckt würde (Fall b). Das würde zu
einem Maß M=2S führen. Die Wahrscheinlichkeit p2S dafür ist gleich /S,
nimmt also mit wachsender Länge  zu bis hin zu eins für =S (Fall c). In
diesem Fall würde das Stück mit an Sicherheit grenzender
Wahrscheinlichkeit eine Segmentgrenze passieren. Im Mittel ergibt sich
79
Gl. 5.2:
M = (1p2S)  S + p2S  2S = S + p2S  S = S + (/S)  S = S + ,
wie man leicht aus der Annahme einer Gleichverteilung der Startposition des
gelernten Stücks der Länge  in Bezug auf die Segmentgrenzen beweisen
kann. Wenn die Versuchsperson nun nicht nur ein, sondern mehrere (n)
Stücke der Länge  erinnern kann, ergibt sich
M = n (S + ).
Gl. 5.3:
Aus dem Modell von Abb. 5.4 folgt also eine lineare Beziehung zwischen
der Segmentlänge S und dem sich ergebenden Kapazitätsmaß M. In
Experiment 6 wurde S variiert, um zu überprüfen, ob sich diese lineare
Relation ergibt.
S

a)
b)
c)
Abb. 5.4: Einfaches Modell der Sensitivität der Versuchsperson gegenüber dem
Austausch von Segmenten (Kästen) als Funktion der Länge und Position des
erinnerten Stücks. Ist die Länge  dieses Stücks kleiner als die Segmentlänge S, dann
gibt es zwei Möglichkeiten: Es kann ganz in ein Segment fallen (Fall a), und dann
wird nur der Austausch dieses Segmentes bemerkt (graue Schattierung). Oder es
überschreitet eine Grenze zwischen zwei Segmenten (Fall b) und führt dazu, daß der
Austausch von jedem der beiden Segmente bemerkt wird. Die Wahrscheinlichkeit für
Fall b ist /S und erreicht eins für =S (Fall c), wo mit an Sicherheit grenzender
Wahrscheinlichkeit eine Segmentgrenze überschritten wird.
I. Methodik
Vier der fünf Versuchspersonen von Experiment 5 nahmen an Experiment 6
teil. Ein Training war nicht mehr erforderlich. Stimuli und Verfahren waren
identisch zu Experiment 5, mit der Ausnahme, daß nur zwei Zykluslängen
80
(2.4 und 4.8 s) getestet wurden, dafür aber zwei Segmentlängen (200 und
400 ms). Die Reihenfolge der Versuche war 4.8/400, 4.8/200, 2.4/400,
2.4/200, und mußte von jeder Versuchsperson viermal absolviert werden, um
insgesamt 64 Datensätze zu erzielen. Tatsächlich wurden 62 gültige
Datensätze erzielt.
II. Ergebnisse
Abb. 5.5 zeigt die Ergebnisse, gemittelt über die vier Versuchspersonen, für
die zwei verschiedenen Werte der Zykluslänge, als Funktion der
Segmentlänge. Die leeren Symbole zeigen die Ergebnisse von Experiment 6
für S=200 ms und S=400 ms. Die vollen Symbole zeigen die Ergebnisse aus
Experiment 5 für S=300 ms. Die Werte aus Experiment 5 wurden dabei nur
über diejenigen Versuchspersonen gemittelt, die auch an Experiment 6
teilgenommen haben. Der Wert 4.8/300 wurde mittels einer linearen
Interpolation der Werte 4.2/300 und 6.0/300 bestimmt.
Wie schon in Experiment 5 sind auch hier die Ergebnisse unabhängig von
der Zykluslänge. Die Daten für 2.4 und 4.8 Sekunden liegen fast
übereinander. Vor allem aber ergibt sich in der Tat eine lineare Beziehung
zwischen M und S, mit der Steigung 1.35, und dem y-Achsenabschnitt 130
ms. Dieser y-Achsenabschnitt entspricht nach Gl. 5.3 der Menge des
erinnerten weißen Rauschens n, also Anzahl der erinnerten Teilstücke mal
Länge dieser Teilstücke. Aus den Daten von Experiment 5 folgt somit, daß
die Versuchspersonen im Durchschnitt n=1.35 Stücke der Länge =95 ms,
im Ganzen also 130 ms weißes Rauschen erinnern konnten.
81
Segmentlänge [s]
Abb. 5.5: Ergebnisse von Experiment 6. Abhängigkeit des errechneten
Kapazitätsmaßes von der Segmentlänge, gemittelt über vier Versuchspersonen, für
zwei verschiedene Zykluslängen. Die Standardabweichungen sind ähnlich zu denen
in Abb. 5.3 und werden hier nicht gezeigt. Die gefüllten Symbole sind aus
Experiment 5 interpolierte Daten. – Die beiden Kurven für 2.4 und 4.8 s fallen fast
aufeinander. Die lineare Beziehung zwischen dem Kapazitätsmaß und der
Segmentlänge (gepunktete Linie) legt nahe, daß der y-Achsenabschnitt (130 ms) ein
valides Maß für die Kapazität des Echogedächtnis für weißes Rauschen darstellt.
Um ein Konfidenzintervall für den y-Achsenabschnitt zu erhalten, wurde
eine ²-Analyse durchgeführt. Dabei wurde angenommen, daß der y-Achsenabschnitt positiv sein müsse, da negative Kapazitätswerte im Sinne der
Gl. 5.3 keinen Sinn ergeben. Außerdem wurde angenommen, daß die
Steigung (das entspricht n in Gl. 5.3) größer oder gleich eins sein müsse,
denn man muß ja mindestens ein Stück erinnern, um die Aufgabe lösen zu
können. Das so ermittelte 95%-Konfidenzintervall für den yAchsenabschnitt (und somit für die Kapazität M=n des Echogedächtnisses
für weißes Rauschen) ist [0,265]ms.
82
5.5 Kapazität und kurzer Speicher: Koinzidenz oder
Zusammenhang?
Die Kapazität des Echogedächtnisses für weißes Rauschen, als
Zeitkonstante ausgedrückt, ist ganz im Sinne der Hypothese erheblich
kleiner als die Lebensdauer. Ein solches Ergebnis läßt sich freilich nur
erzielen, wenn man mit möglichst strukturlosem Stimulusmaterial wie
weißem Rauschen arbeitet. Stimuli mit mehr inhärenter Struktur
(Spachstimuli, Töne) provozieren eine weitergehende Verarbeitung des
Materials (Kategorisierung, chunking), die eine Kapazität für dieses
Stimulusmaterial von mehreren Sekunden vortäuschen. Tatsächlich ist in
diesen Fällen aber nicht mehr das unverarbeitete Signal, sondern eine halb
kategoriale, halb sensorische Repräsentation desselben gespeichert worden.
Die Kapazität für weitgehend unverarbeitete Repräsentationen ist
offensichtlich sehr gering. Sie liegt von ihrer Größe her in dem Bereich, den
Nelson Cowan dem kurzen auditiven Speichers zuordnet. Ist dies ein Zufall,
oder folgt dies aus der Interaktion zwischen kurzem und langem auditiven
Speicher?
Zunächst muß man sich fragen, wie genau der vermessene Wert ist, d.h. ob
die Übereinstimmung durch die Meßgenauigkeit gedeckt wird. Das
Konfidenzintervall beträgt [0,265] ms. Sehr kleine Werte wären schwierig
zu erklären, da sie bedeuten würden, daß die Versuchsperson sich fast nichts
merken kann, dies aber perfekt. Es ist interessanter, sich die obere Grenze
anzuschauen, die trotz der relativ großen Meßunsicherheit bei dem
erstaunlich geringen Wert von 265 ms liegt, selbst für Zyklen von 6
Sekunden Länge. Um genauere Werte zu erhalten, müßten deutlich mehr
Versuchspersonen vermessen werden, da die interindividuelle Variabilität
hoch ist. Das Problem dabei ist der hohe Versuchsaufwand, der durch das
Verfahren bedingt ist. Um zu einem zuverlässigen Wert zu kommen, muß
jede Versuchsperson mindestens sechs unabhängige Sitzungen, die jeweils
recht hohe Konzentration über einen langen Zeitraum erfordern, absolvieren.
Dies
ist
erheblich
mehr,
als
z.B.
zur
Erhebung einer
Kurzzeitgedächtnisspanne erforderlich ist.
Eine andere Frage ist, ob sich mit anderen Methoden dasselbe Maß für die
Kapazität des Echogedächtnisses für weißes Rauschen ergibt. Ein
Kritikpunkt an dem in Experiment 5 und 6 gewählten Verfahren könnte sein,
83
daß durch das induzierte konservative Entscheidungsverhalten weniger JaAntworten gegeben worden sind als Veränderungen detektiert wurden.
Bislang ist dies unvermeidbar, da der Aussagewert des maximum-likelihood
Verfahrens unter falschen Alarmen enorm leiden würde. Es wäre
begrüßenswert, wenn es gelänge, eine Methode zu finden, die die
entscheidungsstrategischen Parameter des Experimentes besser in den Griff
bekommt, und dabei vielleicht auch noch mit weniger Meßaufwand
auskommt, so daß auch eine höhere Statistik und dadurch eine genauere
Abschätzung erzielt werden kann.
Natürlich gilt die in diesem Kapitel ermittelte Kapazitätskonstante nur für
weißes Rauschen. Für redundanteres Material werden sich höhere Werte
finden lassen. Hier stellt sich die Frage, ob die Kapazität sinnvoll in einer
Zeiteinheit oder nicht besser in einer Informationseinheit gemessen werden
müsse. Das Problem dabei wurde schon im einleitenden Abschnitt 5.1
angesprochen:
Solange
die
neuronalen
Kodes
und
ihre
Informationseinheiten nicht bekannt sind, muß Kapazität in am Stimulus
orientierten Einheiten definiert werden. Auch ist keineswegs klar, daß für
anderes Stimulusmaterial überhaupt dieselben Kapazitätsgrenzen gelten
müssen, selbst wenn man die neuronalen Informationseinheiten kennt.
Daher erscheint es gerechtfertigt, die für weißes Rauschen gefundene
Zeitkonstante als Maß für die Kapazität des sensorischen Endes der
Verarbeitungskette anzunehmen.
Es muß betont werden, daß die Kapazität bei einer Aufgabe vermessen
worden ist, bei der gleichzeitig ein Erinnern über bis zu sechs Sekunden
nötig war, um sie richtig zu lösen. Die Lebensdauer von mehreren Sekunden
qualifiziert die PR-Wahrnehmung eindeutig als Phänomen des langen
auditiven Speichers (siehe auch Abschnitt 4.3). Da sich beide Zeitkonstanten
bei ein und derselben Aufgabe zeigen, handelt es sich bei der Kapazität nicht
um ein Überbleibsel der Lebensdauer, unter anderen Umständen gemessen,
sondern um eine gleichzeitig gültige Zeitkonstante, wirksam im selben
Phänomen. Dies wird auch aus der Unabhängigkeit dieser beiden
Zeitkonstanten deutlich: Die mittels periodischem Rauschen gemessene
Kapazität bleibt konstant für Periodenlängen zwischen 1.2 und 6 Sekunden.
Es kann daher davon ausgegangen werden, daß sie eine eigene Zeitkonstante
darstellt, die die zeitliche Dynamik eines zweiten, vom Spurzerfall
unabhängigen Vorgangs beschreibt. Dieser Vorgang hängt wie der
84
Spurzerfall mit dem Erinnern zusammen, und erst beide zusammen
beschreiben die zeitliche Dynamik des Erinnerns vollständig.
Man kann es als zufällige Koinzidenz ansehen, daß die Größe der Kapazität
des langen auditiven Speichers für weißes Rauschen in dem Bereich liegt,
den Nelson Cowan dem kurzen auditiven Speicher zuordnet. Andererseits ist
es denkbar, daß die selektive Informationsweitergabe vom kurzen an den
langen sensorischen Speicher durch die Lebensdauer des kurzen Speichers
beschränkt ist. Diese Begrenzung der Informationsselektion würde sich im
langen Speicher als Kapazitätsgrenze ausdrücken. Damit solche
Überlegungen aber nicht im Bereich des Spekulativen bleiben, ist es
wichtig, Anhaltspunkte über die Art der Prozesse zu gewinnen, die der PRWahrnehmung zugrundeliegen. Dies ist das Anliegen des nächsten Kapitels.
85
86
6 Mechanismen des Echogedächtnisses
Dieses Kapitel beschäftigt sich mit dem Mechanismus des
Echogedächtnisses am Beispiel der PR-Wahrnehmung. Dazu werden im
Abschnitt 6.1 introspektive Beobachtungen bei der PR-Wahrnehmung
geschildert. In Abschnitt 6.2 werden verschiedene Modelle vorgestellt, die
die Unterschiede in der Wahrnehmung periodischen und nichtperiodischen
Rauschens erklären können. Es wird deutlich, daß die Entscheidung
zwischen diesen Modellen nur mit psychophysiologischen Methoden
getroffen werden kann. Abschnitt 6.3 führt eine Variante von periodischem
Rauschen ein, die besonders geeignet für EEG-Untersuchungen ist: das
semiperiodische Rauschen. Zwei Verhaltensexperimente zu diesem Stimulus
werden vorgestellt. Dies kann als Vorarbeit gesehen werden für das
Experiment 9, das in Abschnitt 6.4 beschrieben wird und zwischen den in
Abschnitt 6.2 beschriebenen Modellen unterscheiden soll. Nachdem das
Ergebnis in Abschnitt 6.5 diskutiert wird, folgt in Abschnitt 6.6 basierend
auf den in dieser Arbeit erhobenen Befunden ein Modell des
Echogedächtnisses, das Implikationen auch für Modelle des
Kurzzeitgedächtnisses hat. In Abschnitt 6.7 werden Bezüge zum verwandten
Paradigma des primings diskutiert.
6.1 Phänomene der PR-Wahrnehmung
Die Wahrnehmung von kontinuierlichem weißem Rauschen wird im
wesentlichen durch einen einzigen perzeptuellen Parameter charakterisiert:
die Lautstärke (entsprechend dem physikalischen Parameter der Amplitude).
Ansonsten klingt weißes Rauschen homogen. Bei genauerem Hören gelingt
es, das Vorhandensein von Fluktuationen wahrzunehmen, allerdings mehr
auf einem allgemeinem Niveau („es fluktuiert“), und ohne daß die einzelnen
Fluktuationen deutlich genug wahrgenommen werden, um Gestalt
anzunehmen und beschrieben werden zu können. Das ist völlig anders bei
der Wahrnehmung von periodischem Rauschen, wo die einzelnen
Fluktuationen gut beschreibbare Perzepte auslösen, die auch gerne mit
Vergleichen aus dem Alltag („Scheibenwischer“, „Säge“) belegt werden.
Dieser Unterschied soll durch eine kleine Anekdote verdeutlicht werden: Als ich das
erste Mal periodisches Rauschen auf dem Computer erzeugt hatte und mir diesen
87
Stimulus anhörte, war ich davon überzeugt, falsch programmiert zu haben. Es hörte
sich nicht nach Rauschen an. Normales weißes Rauschen hatte ich schon erfolgreich
programmiert und wußte, wie es klingt. Bei dem periodischen Rauschen hörte man
zwar auch das Rauschen, darin aber periodisch wiederkehrend deutliche Strukturen.
Ich war sicher, daß dies an Artefakten lag, die ich beim Periodisieren des weißen
Rauschens eingebaut hatte. Enttäuscht gab ich die Kopfhörer meinem Kollegen. Ich
schilderte ihm den Grund meiner Enttäuschung und meinen Höreindruck. Er hörte
sich die Sache an und bestätigte mir, das ich etwas falsch gemacht haben müsse,
denn er könne ganz deutlich die Artefakte hören. Er beschrieb sie mir, und zu meiner
Überraschung hörte er völlig andere „Artefakte“ als ich. Wir kamen schließlich zu
dem Ergebnis, daß es vielleicht doch nicht an meinen Programmierfähigkeiten lag,
sondern daran, daß jeder von uns auf seine eigene Weise den an und für sich perfekt
zyklischen Stimulus strukturierte.
Zunächst drängt sich die Frage auf, warum periodisches Rauschen so anders
klingt. Bei genauer Betrachtung erscheint aber die strukturierte
Wahrnehmung von periodischem Rauschen nicht mehr so unplausibel. Das
Signal ist in Wirklichkeit nicht homogen, ganz im Gegenteil, es ist
sozusagen maximal inhomogen, es fluktuiert so stark als eben möglich. Es
ist ein Leichtes, sich vorzustellen, daß diese Fluktuationen zu
wahrnehmbaren Perzepten führen (siehe auch die Diskussion zu Abb. 3.12).
Die Frage lautet also eigentlich: Warum klingt weißes Rauschen im
Normalfall (d.h. nicht iteriert) homogen?
Ein Modell des Echogedächtnisses müßte neben diesem Grundphänomen
der Hörbarwerdung von Perzepten in periodischem Rauschen einige weitere
introspektive Beobachtungen zu den Wahrnehmungsunterschieden von
weißem und periodischem Rauschen erklären können:
 Wenn ein periodischer Rauschstimulus aus genau vier Iterationen eines
bestimmten Rauschsegmentes aufgebaut ist, also z.B. bei einer
Periodenlänge von 0.8 Sekunden genau 3.2 Sekunden dauert, dann hört
auch eine hochtrainierte Versuchsperson nicht viermal ein bestimmtes
perzeptuelles Ereignis, sondern nur dreimal. Während des ersten Zyklus
ist das Perzept nicht vorhanden. Das liegt nicht etwa an der Überraschung
beim Einschalten des Rauschens, denn wenn man diesen 3.2-SekundenStimulus zweimal kurz nacheinander darbietet, dann kann man beim
zweiten Mal in allen vier Zyklen das Perzept wahrnehmen. Liegt
dazwischen jedoch eine Störaufgabe, dann kann es sein, daß man es
wieder nur dreimal hört, ja evtl. etwas ganz anderes aus dem Rauschen
heraushört (siehe Experiment 1). Es muß also einen wesentlichen
88
Unterschied machen, ob der entsprechende Abschnitt der Wellenform
schon vor kurzem zu hören war oder nicht. Im ersten Zyklus liegt noch
keine Wiederholung vor, und ohne diese Wiederholung klingt er wie nicht
repetiertes Rauschen: homogen.
 In Experimenten mit langen Rauschzyklen (z.B. Experiment 4, 5, 6)
geben die Versuchspersonen immer an, daß der größte Teil des
Rauschzyklus homogen klingt. Lediglich ein kurzer Moment des
Rauschzyklus klingt anders: hier hört man etwas heraus. In diesem Fall
werden alle Teile des Rauschzyklus bereits zum wiederholten Male
präsentiert, aber nur ein kleiner Teil (entsprechend dem
Fassungsvermögen, der Kapazität des Echogedächtnisses) wird
wiedererkannt und löst die Perzepte aus. Was nicht in das Echogedächtnis
aufgenommen werden kann, klingt homogen.
 Bei erschwerten Situationen, wie z.B. der Wahrnehmung
semiperiodischen Rauschens (Abschnitt 6.3), oder auch bei langen
Zyklen, tritt immer wieder ein introspektiv erfahrbarer Lerneffekt auf:
Man hat viele Zyklen lang zugehört und nichts heraushören können.
Dann kommt das Perzept, erst schwach, und dann immer deutlicher, so
daß man sich am Ende fragt, warum man es nicht gleich gehört hat. Aber
bevor dieses Detail „gelernt“ ist, klingt das Rauschen homogen.
Der nächste Abschnitt stellt verschiedene mögliche Erklärungen für die
beobachteten Wahrnehmungsunterschiede vor.
6.2 Restaktivierung versus sensorische Vorbereitung
Es ist für die folgenden Überlegungen nützlich, sich einen kurzen
Augenblick mit Filtermodellen der Aufmerksamkeit zu beschäftigen, auch
wenn die später vorgestellten Modelle der PR-Wahrnehmung für diesen
Zweck keine expliziten Filter benötigen. Broadbent (1958) beschäftigte sich
mit Aufmerksamkeitseffekten
beim
dichotischen
Hören.
Den
Versuchspersonen wurde ein Kopfhörersignal mit verschiedenen
Sprachsignalen auf den beiden Kanälen präsentiert, und sie sollten einen der
beiden Kanäle „beschatten“ (d.h. nachsprechen). Sie konnten dann in der
Regel keine Angaben über das Sprachsignal auf dem nicht beachteten Ohr
machen, es sei denn, dort wechselte die Tonlage des Sprechers o.ä.
Broadbent entwarf darauf ein Modell eines frühen, vorsemantischen Filters,
89
der zur besseren Erfüllung der eigentlichen Aufgabe (Beschatten des eines
der beiden Kanäle) regelmäßige Signale auf dem irrelevanten Ohr
(sogenannte habituierte Signale) ausfiltert. Dieses Modell kann
Beobachtungen nicht erklären, die auf eine semantische Verarbeitung der
irrelevanten Kanäle hindeuteten, wie z.B. das Erkennen des eigenen Namens
im irrelevanten Sprachsignal.
Treisman (1960, 1964) nahm an, daß der Filter die unterdrückten
Eingangskanäle nicht vollständig auslösche, sondern nur abschwäche.
Semantisch signifikante Gedächtniselemente wie z.B. der eigene Name
würden trotz der Abschwächung Beachtung finden. Cowan (1988) schlug
vor, diese Annahme wie folgt zu interpretieren: Ein durch den Filter
abgeschwächtes Eingangssignal führt nicht etwa nur bedingt (bei semantisch
relevanten Elementen) zur Aktivierung und dann aber auch automatisch zur
Bewußtwerdung, sondern sie führt in jedem Falle zu einer Aktivierung. Aber
nur bei semantisch relevanten Elementen reicht das Ausmaß der Aktivierung
aus, um Beachtung und Bewußtheit zu erreichen. Bei dieser Interpretation
Bewußt seins schwelle
a
b
c
Filter
Abb. 6.1: Schematische Darstellung der Cowanschen (1988) Interpretation des
Treismanschen Modells. Drei Fälle werden unterschieden: a) Der Eingang wird
willentlich beachtet oder stellt ein neues Signal dar. Er wird nicht durch das Filter
abgeschwächt. Die ausgelöste Aktivierung ist stark genug, um die
Bewußtseinsschwelle zu überschreiten. b) Der Eingang wird nicht beachtet und stellt
kein neues Signal dar (d.h. er ist habituiert). Seine Erregungswirkung wird durch das
Filter abgeschwächt, die Aktivierung ist zu schwach, um die Bewußtseinsschwelle zu
überschreiten. c) Der Eingang wird durch das Filter geschwächt, aber er aktiviert ein
semantisch relevantes Element (z.B. den eigenen Namen). Die schwache Erregung
reicht aus, um eine starke, die Bewußtseinsschwelle überschreitende Aktivierung
auszulösen.
90
wird also eine Trennung von Aktivierung und Aufmerksamkeit
angenommen: nicht jeder aktivierte Zustand wird auch beachtet. Diese
Interpretation ist in Abb. 6.1 schematisch dargestellt. In Cowans bereits in
Kapitel 1 in Auszügen vorgestellten Gedächtnismodell (siehe auch Abb. 1.3
auf Seite 10) gibt es dementsprechend aktive Zustände des langen
sensorischen Speichers, die den Fokus der Aufmerksamkeit erreichen, und
solche, die dies nicht schaffen.
Im Gegensatz zu den Experimenten zur Aufmerksamkeit geht es bei der PRWahrnehmung nicht um gut hörbare Perzepte, sondern um schwellennahe
Erregungen. Cowans Vorstellung der unter– bzw. überschwelligen
Aktivierung ist aber auch hier von Nutzen. Man benötigt allerdings keinen
Filter, da die durch die Fluktuationen ausgelösten Eingangssignale schon
von sich aus so schwach sind, daß sie die Bewußtseinsschwelle nicht
erreichen. Dies würde erklären, warum bei normalem nichtperiodischen
Rauschen keine Perzepte hörbar werden. Dies ist in Abb. 6.2a dargestellt.
Abb. 6.2 b)-d) stellt verschiedene Ansätze vor, die die bei der PR-Wahrnehmung hörbar werdenden Perzepte erklären sollen. Wenn man annimmt (Teilbild b), daß die bei der ersten Präsentation eines Rauschsegments erfolgte
schwache Aktivierung von Gedächtniselementen eine Zeitlang erhalten
bleibt, wird bei der erneuten Präsentation desselben Segmentes die Erregung
auf noch schwach aktive Elemente treffen, die dadurch verstärkt aktiviert
werden und die Schwelle zum Bewußtsein überschreiten. Bei diesem Ansatz
wird allerdings nicht verständlich, warum nur eine begrenzte Anzahl von
Elementen zu Perzepten führt. Beim Hören eines sechs Sekunden langen
Zyklus müßten, wenn die Lebensdauer der Aktivierung ausreicht, die ganzen
sechs Sekunden strukturiert klingen. Wenn die Lebensdauer nicht mehr
reicht, müßten die ganzen sechs Sekunden homogen klingen. Die in Kapitel
5 über einen breiten Bereich von Zykluslängen für konstant befundene
Kapazität widerspricht diesem Ansatz.
In Teilbild c) wird daher angenommen, daß die unbewußt bleibende
Vorerregung ebenso wie stärkere, bewußt werdende Aktivierungen derselben
Elemente an die Kapazitätsgrenzen des Kurzzeitgedächtnisses gebunden
sind. Nur eine gewisse Anzahl von Elementen bleibt aktiviert, die übrigen
werden im Sinne einer Interferenz gehemmt. Die hemmenden Interferenzen
sind in Teilbild c) in Analogie zu Verknüpfungsdiagrammen in der
Neurophysiologie als Verknüpfungen mit Querbalken dargestellt. Es ist
91
sicherlich nicht intuitiv plausibel, von einem zwar nicht bewußten, aber
selektiven Prozeß auszugehen, doch stimmt diese These durchaus mit der
introspektiven Erfahrung bei willentlicher Periodizitätsentdeckung in
längeren Zyklen überein. Bei diesem Modell stellt die Vorerregung den
alleinigen Mechanismus der Hörbarkeit der wiederholt angebotenen
Rauschsegmente dar. Die zweite Aktivierung fällt nur deshalb stärker aus,
weil sie auf noch leicht aktive Elemente im langen sensorischen Speicher
trifft.
92
b) Restaktivierung
a) nichtperiodisches
Rauschen
K
S
S
c) kapazitiv begrenzte
Restaktivierung
K
S
S
K
S
S
d) sensorische
Vorbereitung
K
S
S
K
S
S
Abb. 6.2: Cowans Aktivierungshypothese angewandt auf die PR-Wahrnehmung.
Dabei wurde Abb. 6.1 um den kurzen sensorischen Speicher (KSS) ergänzt.
a) Bei gewöhnlichem Rauschen werden die entsprechenden Elemente im
sensorischen Langzeitgedächtnis schwach erregt. Die Aktivierung reicht nicht aus,
um die Schwelle zum Bewußtsein zu überschreiten. Das Rauschen klingt homogen.
b) Wenn die in a) schwach erregten Elemente hinreichend lange erregt bleiben,
kann dasselbe Signal beim nächsten Mal eine stärkere, überschwellige Aktivierung
auslösen. Dies widerspricht der Kapazitätsbeschränkung des Echogedächtnisses, da
alle aktivierten Elemente beim zweiten Mal hörbar werden müßten.
c) Eine Modifikation von Annahme b) ist, daß nur für einige wenige Elemente
der Erregungszustand erhalten werden kann, so daß nur diese hörbar werden. Die
anderen Elemente werden gehemmt (graue Linien mit Querbalken).
d) Ein alternativer Vorschlag ist, daß eine in ihrer Kapazität begrenzte
sensorische Vorbereitung stattfindet, so daß bei der nächsten Darbietung die
Erregung der (wenigen) vorbereiteten Elemente stärker ausfällt.
Eine alternative Erklärung wird in Teilbild d) angeboten. Es wird
angenommen, daß die Erregung aller Elemente (wie bei b) noch eine
Zeitlang anhält, aber daß diese Tatsache alleine nicht ausreicht, um bei der
nächsten Präsentation bei gleichschwachem Eingang eine verstärkte
Aktivierung auszulösen. Einige Elemente konnten jedoch im Sinne einer
Vorbereitung top-down auf vorgeschaltete sensorische Stufen (nach Cowans
93
Modell: im kurzen sensorischen Speicher) einwirken. Bei der nächsten
Darbietung erfahren diese Elemente einen verstärkten Eingang (beachte die
Pfeilfarbe des Eingangs im rechten unteren Teilbild) und lösen eine
ausreichende Aktivierung aus.
Dieser Vorbereitungsmechanismus muß eine Kapazitätsgrenze aufweisen,
um mit den Befunden von Kapitel 5 übereinzustimmen. Der Mechanismus,
der zu dieser Kapazitätsbegrenzung führt, wird zunächst noch offengelassen.
Der Zeitpunkt der top-down Aktivierung der sensorischen Areale muß in der
Nähe des Wiederauftretens des Signals liegen, da die Information sich nicht
lange genug im kurzen sensorischen Speicher halten kann. Bei unbekannter
Periode erfordert dies eine Art dauernder Auffrischung, während bei
bekannter Periode eventuell eine gezielte Aktivierung zum erwarteten
Zeitpunkt des Auftretens erfolgt.
Beide Modelle (Restaktivierung und sensorische Vorbereitung) sind mit den
introspektiven Beobachtungen aus Abschnitt 6.1 vereinbar. Der erste Zyklus
führt nicht zu Perzepten, da er, wie in Teilbild a) gezeigt, zu schwache
Aktivierungen auslöst. Der überwiegende Teil von langen Zyklen klingt
homogen, da beide Mechanismen eine Kapazitätsbeschränkung vorsehen
und daher nur wenige Elemente zu Perzepten führen. Der für normales
periodisches Rauschen bei aufmerksamem Zuhören wahrnehmbare
allgemeine „Fluktuationseindruck“ erklärt sich aus den schwachen, gerade
noch nicht zu bewußten Perzepten führenden Aktivierungen. Der
wesentliche Unterschied zwischen diesen beiden Ansätzen ist, daß es bei
dem Vorbereitungsmodell zu einer Beeinflussung früher sensorischer Stufen
kommt, die bei dem auf einer Restaktivierung beruhenden Modell nicht
stattfindet. Die Unterscheidung zwischen diesen beiden grundverschiedenen
Annahmen kann nicht auf der Basis von Verhaltensexperimenten getroffen
werden. Es ist allerdings möglich, die Entscheidung mit Hilfe
elektrophysiologischer
Methoden
zu
treffen,
da
sich
beim
Restaktivierungsmodell bei unveränderter sensorischer Verarbeitung der
Fluktuationen keine veränderten sensorischen Potentiale im Zusammenhang
mit der erfolgreichen Detektion periodischen Rauschens finden lassen
sollten, während beim Vorbereitungsmodell gerade die sensorischen Areale
erregt werden müßten. Bevor aber das entscheidende Experiment
durchgeführt werden kann (Abschnitt 6.4), muß zunächst ein für EEG-Un-
94
tersuchungen geeignetes Stimulusmaterial gefunden werden. Davon handelt
der nächste Abschnitt.
6.3 Stimulusmaterial für EEG-Untersuchungen
Dieser Abschnitt beschreibt eine besonders für EEG-Untersuchungen
geeignete Variante von periodischem Rauschen, das semiperiodische
Rauschen (Abschnitt 6.3.1), sowie ein Verhaltensexperiment mit diesem
Stimulus (Abschnitt 6.3.2), das Unterschiede zu normalem periodischen
Rauschen aufzeigen soll.
6.3.1 Periodisches und semiperiodisches Rauschen
Bei der Erhebung ereigniskorrelierter Potentiale (EKPs) im
Elektroenzephalogramm (EEG) ist es ganz wesentlich, daß man den
Zeitpunkt des Ereignisses kennt, zu dem die Potentiale korreliert werden
sollen. Im Falle von periodischem Rauschen bietet sich an, die Potentiale zu
demjenigen Zeitpunkt zu korrelieren, der in der Rauschprobe als Träger der
das Perzept auslösenden Fluktuation angesehen werden kann. Bei dem
bisher verwendeten periodischen Rauschen stellt dies ein Problem dar, da
wir nicht genau wissen, welches Teilstück des Rauschens das Perzept
ausgelöst hat. Die in den Experimenten 2 und 3 vorgenommenen
Untersuchungen zu den das Perzept auslösenden Teilen des Spektrogramms
wären für diesen Zweck nicht genau genug. Sie müßten im übrigen für jede
Rauschprobe und jede Versuchsperson getrennt erhoben werden, was einen
ziemlichen Aufwand bedeuten würde. Die zeitliche Zuordnung leidet
insbesondere unter dem Umstand, daß die einzelnen Versuchspersonen
unterschiedliche Antizipationszeiten (bzw. bei langen Zyklen, wo
Antizipation nicht mehr funktioniert: Reaktionszeiten) haben, so daß aus
dem Tappzeitpunkt nicht zuverlässig auf den Perzeptzeitpunkt geschlossen
werden kann. Außerdem ist das Tappen auch nicht so präzise, so daß auch
deshalb eine nur ungenaue Bestimmung des Perzeptzeitpunktes erfolgen
kann. Dies alles würde dazu führen, daß durch die ungenaue Bestimmung
des Ereigniszeitpunktes die korrelierten Potentiale verschmiert würden, bis
hin zur Unterdrückung von Komponenten.
Eine spezielle Variante des Stimulus ist besser für die Erhebung von EKPs
geeignet, das sogenannte semiperiodische Rauschen (SPR). Hierbei ist nur
95
K
A
K
B
K
C
Abb. 6.3: Erläuterung der Konstruktion von semiperiodischem Rauschen. Jeder
Buchstabe stehe für ein Stück weißes Rauschen, dabei sei K ein Stück von 200 ms
Länge, und A,B,C... andere Stücke der Länge 600 ms. Die Periode beträgt in diesem
Fall 800 ms. Wenn man nicht aufmerksam zuhört, entgeht einem die partielle
Regelmäßigkeit, und es hört sich wie normales weißes Rauschen an.
ein kleiner Teil der Periode repetitiv, der Rest ist neues, kontinuierliches
Rauschen. Abb. 6.3 erläutert die Konstruktion dieses Stimulus.
Semiperiodisches Rauschen bedarf erhöhter Aufmerksamkeit seitens der
Versuchsperson, da ihr die partielle Regelmäßigkeit leicht entgehen kann
und es sich dann wie normales weißes Rauschen anhört. Der Vorteil für die
Erhebung ereigniskorrelierter Potentiale ist offensichtlich: Wenn die
Versuchsperson überhaupt ein Perzept wahrnimmt, dann ist der zeitliche
Träger mit Sicherheit auf das konstante Segment beschränkt. Da zudem
wegen des insgesamt geringeren Informationsgehalts die Variabilität bei der
Interpretation deutlich eingeschränkt ist, und da eine gewisse Mindestlänge
des zeitlichen Trägers gegeben sein muß, um überhaupt ein Perzept
auszulösen, ist der tatsächliche Ereigniszeitpunkt sogar besser definiert als
im Rahmen der Länge des konstanten Segments.
Bevor dieser Stimulus aber in EEG-Untersuchungen angewendet wird, soll
zunächst in Verhaltensexperimenten überprüft werden, welche
Veränderungen sich für semiperiodisches Rauschen ergeben. Dabei soll
folgende Hypothese überprüft werden:
HYPOTHESE:
Die PR-Wahrnehmung beruht auf der Verarbeitung und Speicherung von Details der
Wellenform, die sich auf kleine Zeitbereiche eingrenzen lassen. Diese „Träger“ der
Perzepte wirken auch in Isolierung (d.h. wenn das benachbarte Rauschen sich nicht
gleichfalls wiederholt), und weisen eine unterschiedliche Signifikanz auf.
6.3.2 Experiment 7: Detektierbarkeit von SPR
I. Methodik
Zwei der fünf Versuchspersonen von Experiment 2 nahmen an diesem
Experiment teil (CK=D1, ME=D3). Dieselben sechs Sekunden periodisches
Rauschen wie in Experiment 2 wurden vorbereitet und im Speicher des
96
Computers abgelegt. Als Digitalisierungsfrequenz wurde wieder 20 kHz
verwendet. An einer zufälligen Stelle wurde ein 200 ms langes Segment
herausgeschnitten und als konstantes Segment in semiperiodischem
Rauschen (siehe Abb. 6.3) verwendet. Die Periodenlänge war zufällig
zwischen 600 und 1000 ms gewählt, der Rest der Periode wurde mit nicht
repetitivem, gleich lautem weißem Rauschen aufgefüllt (das nicht aus der
sechs Sekunden langen Gesamtrauschprobe stammte). Die Aufgabe der
Versuchsperson war, den gehörten Rhythmus mit Tappen anzuzeigen. Die
Versuchsperson hatte nach dem Start der Darbietung des semiperiodischen
Rauschens zwölf Sekunden Zeit, mit dem Tappen anzufangen. Fing die
Versuchsperson rechtzeitig mit Tappen an, so wurde die Darbietung falls
nötig verlängert, um ihr das Mittappen in acht Zyklen zu ermöglichen. Hatte
sie nach 12 Sekunden nicht mit Tappen angefangen, oder stimmte die
getappte Periode nicht mit der wirklichen Periode überein (wobei dasselbe
Kriterium wie in Experiment 2 angewandt wurde), so wurde dieser
Einzelversuch als Mißerfolg gewertet. Ausgewertet wurde die Häufigkeit,
mit der eine bestimmte Rauschprobe erfolgreich getappt werden konnte, in
Abhängigkeit von ihrer Position in den sechs Sekunden der Gesamtrauschprobe. Beide Versuchspersonen absolvierten 1000 Einzelversuche.
Daraus folgt, daß jeder Zeitpunkt in der Gesamtrauschprobe in ungefähr 33
 6 Einzelversuchen vorkam.
II. Ergebnisse
In Abb. 6.4 sind die Ergebnisse von Experiment 7 wiedergegeben. Die yAchse repräsentiert die Häufigkeit korrekten Tappens, und die x-Achse die
Position des Segmentes in der Gesamtrauschprobe. Im oberen Teilbild
werden die beiden Kurven für Versuchsperson CK und ME verglichen,
während in den beiden unteren Teilbildern für jede der beiden
Versuchspersonen die Leistung in Experiment 7 mit der Verteilung der
Tappzeitpunkte in Experiment 2 verglichen wird.
Die Erfolgsquote war im Mittel besser als 50%, aber es wurden große
Unterschiede zwischen den verschiedenen Segmenten deutlich. Während
einige Segmente fast sicher entdeckt wurden, waren andere schwierig zu
entdecken. Somit kann die Hypothese als bestätigt angesehen werden. Die
Signifikanz der Segmente ist in bemerkenswerter, wenn auch nicht perfekter
Weise zwischen den beiden Versuchspersonen korreliert. So sind die Kurven
97
im Bereich von 0.5 bis 2.1 fast deckungsgleich, während in anderen
Bereichen ([2.3,2.6], [4.1,4.8]) die Kurve von ME diejenige von CK auf
einem etwas niedrigeren Niveau parallel verfolgt. Das ist von dem
verschiedenen Ausmaß des Trainings her zu erwarten, denn CK ist der Autor
und daher in noch weitaus höherem Maße trainiert als ME.
Abb. 6.4: Ergebnisse von Experiment 7. Im oberen Teilbild werden die Leistungen
der beiden Versuchspersonen (in Prozent korrekten Mittappens) beim Mittappen zu
semiperiodischem Rauschen als Funktion der Position des konstanten Segmentes in
der Gesamtrauschprobe verglichen. Die unteren beiden Teilbilder vergleichen für
jede der beiden Versuchspersonen diese Leistung mit der Verteilung der
Tappzeitpunkte in Experiment 2.
98
Es gibt eine bemerkenswerte Ausnahme von diesem Trend: bei 5.0 ist die
Leistung für Versuchsperson CK recht niedrig (15%), während ME in 45%
der Fälle erfolgreich ist. Dies entspricht der fehlenden Linie bei 5.0 in
Experiment 2, die auch in Rauschprobe E in Experiment 3 von CK nicht
gewählt wurde. Die spektrale Analyse hatte in Experiment 3 für <E,ME>
eine Interaktion zwischen verschiedenen Kanälen ausgemacht, die für CK
offensichtlich nicht signifikant war. Jetzt können wir in der Interpretation
noch weiter gehen: sie war nicht nur nicht signifikant, sondern konnte von
CK auch bei isolierter Präsentation nicht wahrgenommen werden.
In den unteren beiden Teilbildern von Abb. 6.4 werden die Leistungen der
beiden Versuchspersonen in Experiment 7 mit den histogrammierten
Tappzeitpunkten aus Experiment 2 verglichen. Hohe Histogrammbalken
entsprechen stets guten Entdeckungsleistungen für das entsprechende
Segment in semiperiodischem Rauschen, aber das Umgekehrte gilt nicht.
Hohe Erfolgsquoten bei 3.45 haben nicht zu erhöhter Tapphäufigkeit in
Experiment 2 geführt. Die Perzepte, die bei 3.1 und 3.6 ausgelöst werden,
scheinen stärker zu sein und das ansonsten gut hörbare Perzept bei 3.45 zu
unterdrücken.
Während diese grundsätzliche Untersuchung eine schöne Übereinstimmung
der Tappzeitpunkte und der Entdeckungshäufigkeit gezeigt hat und damit
eine gute nachträgliche Rechtfertigung für die Verwendung der Tappaufgabe
geliefert hat, hat sie doch auch eine Notwendigkeit deutlich gemacht: Wegen
der großen perzeptuellen Unterschiede verschiedener Rauschsegmente muß
die Auswahl von Segmenten für ein EEG-Experiment gut überlegt sein und
den jeweiligen Versuchspersonen angepaßt werden.
6.4 Elektrophysiologische Überprüfung der Modelle
Im folgenden wird mit Hilfe elektrophysiologischer Untersuchungen die in
Abschnitt 6.2 aufgeworfene Frage beantwortet, ob ein kognitiver
Aktivierungserhalt oder eine sensorische Vorbereitung die Wahrnehmung
von periodischem Rauschen besser beschreibt. Dabei ist zunächst eine
Voruntersuchung nötig (Abschnitt 6.4.1), in der besonders geeignete
Segmente speziell für die an der EEG-Untersuchung (Abschnitt 6.4.2)
teilnehmenden Versuchspersonen selektiert werden.
99
6.4.1 Experiment 8: Signifikanz einzelner Segmente
Bei diesem Experiment sollte für die Versuchspersonen des EEG-Experimentes solche Segmente gefunden werden, bei denen im Durchschnitt eine
hohe Erkennungsleistung stattfand. Das war wichtig, weil im Gegensatz zu
Experiment 7 nur 100-ms lange konstante Segmente zum Einsatz kommen
sollten, um eine möglichst gute Ereigniskorrelation im EEG-Experiment zu
realisieren. Für derart kurze Segmente ist es recht schwer, die Periode zu
entdecken. Daher wurde eine Art der Präsentation gewählt, bei der das
Detektieren des wiederkehrenden Segmentes erleichtert wird. Diese Art von
Einzelversuch wird im folgenden als „leichter“ Einzelversuch bezeichnet. Er
korrespondiert zu der Art von Einzelversuchen, die schließlich im EEGExperiment zum Einsatz kamen. Andererseits muß man aufpassen, daß man
nicht überselektiert: Wenn man lange genug würfelt, kommt auch einmal
zufällig ein Sinuston heraus. Die Segmente sollten nicht so signifikant sein,
daß die Entdeckung trivial ist, denn dann wäre nicht die Beteiligung des
Echogedächtnisses nötig gewesen, um sie zu hören. Daher wurde eine
„schwere“ Vergleichsaufgabe eingeführt, die im Idealfall für das Segment
nicht zu lösen ist. Es sollten solche Segmente gefunden werden, bei denen
die leichten Einzelversuche zuverlässig gelöst wurden, die schweren
hingegen nicht. Gleichzeitig diente dieses Experiment auch als Training für
das EEG-Experiment.
I. Methodik
Als Versuchspersonen nahmen die 20 Studenten aus dem zweiten
Studienjahr in Psychologie teil, die auch schon an Experiment 4
teilgenommen hatten. Als Reizmaterial kam semiperiodisches Rauschen
zum Einsatz. Für die fixen Segmente wurden die sechs schon bekannten
Sekunden weißes Rauschen (Experimente 2,3,7: 120000 Punkte Gaußsches
Rauschen mit Index 1 des Zufallszahlengenerators aus dem Anhang Anhang
A:.A.4, gewandelt mit 20 kHz.) in 60 verschiedene 100-ms Bruchstücke
zerlegt, also [0,0.1],[0.1,0.2],... Unter diesen 60 Segmenten sollten nun die
geeignetsten herausgefunden werden.
Dazu wurden mit jedem zufällig aus dem 60-er Pool ausgewählten Segment
nacheinander zwei Einzelversuche durchgeführt, die im folgenden „schwer“
und „leicht“ genannt werden. Im „schweren“ Einzelversuch startete der
100
Stimulus mit 1-2 Sekunden kontinuierlichem Rauschen, bevor das erste Mal
das fixe Segment vorkam. Dadurch wurde verhindert, daß die
Versuchsperson im voraus wußte, an welcher Stelle des Rauschens das fixe
Segment vorkommt. Dann folgte fünfmal das konstante Segment von 100
ms, mit jeweils 900 ms Füllrauschen dazwischen (also semiperiodisches
Rauschen mit 10% fix und 90% variabel), und dann, wiederum nach 900ms
Füllrauschen, evtl. (mit 50% Wahrscheinlichkeit) ein sechstes Mal das
konstante Segment, sonst andere 100 ms Rauschen. Dann folgte wiederum
weißes Rauschen bis zur Gesamtstimulusdauer von 8.1 Sekunden.
Zeitgleich mit dem sechsten Vorkommen des Segmentes (oder seiner
Auslassung) wurde auf dem Computermonitor ein Fragezeichen
ausgegeben. Abb. 6.5 erläutert den Stimulusaufbau.
900 ms
1-2 s
K
V
K
V
K
V
K
V
K
V
?
1-2 s
Gesamtstimulusdauer 8.1 Sekunden
Abb. 6.5: Erläuterung des Stimulusaufbaus im „schweren“ Einzelversuch von
Experiment 8. Die Stimulusgesamtdauer unterteil sich in eine Einleitung mit
zufälligem weißem Rauschen von 1-2 Sekunden, einer Phase semiperiodischen
Rauschens (K: 100 ms fix, V: 900 ms variabel) mit 5 oder 6 Vorkommen des fixen
Segmentes, und einer Ausleitphase von 1-2 Sekunden. Ein- und Ausleitung betragen
zusammen 3 Sekunden. Zeitgleich mit der Stelle, an der evtl. das sechste Mal
Segment K vorkommt, erscheint auf dem Computermonitor ein Fragezeichen.
Die Versuchsperson sollte angeben, ob ihrer Meinung nach zeitgleich mit
dem Fragezeichen ein Segment da war („Ja“), ob definitiv kein Segment da
war („Nein“), oder ob sie das nicht entscheiden konnte („weiß nicht“). Wenn
sie bis dahin das Segment gefunden hatte, dann fiel ihr diese Antwort leicht,
d.h. sie konnte sowohl Anwesenheit als auch Abwesenheit des Segmentes
eindeutig feststellen. Wenn sie das Segment dagegen noch nicht gefunden
hatte, konnte sie nur raten bzw. mit „weiß nicht“ antworten.
Danach wurde mit demselben Segment ein „leichter“ Einzelversuch
durchgeführt, bei dem der Versuchsperson das Finden des Segmentes
deutlich erleichtert wurde. Dazu startete wiederum nach einer Einleitphase
weißen Rauschens das semiperiodische Rauschen mit einer sehr kurzen
Periodenlänge von 200 ms (100 ms fix, 100 ms variabel). Dieses 50%-
101
semiperiodische Rauschen ist erheblich leichter zu finden als 10%semiperiodisches Rauschen. Zusätzlich wurde bei jedem Vorkommen des
Segmentes zeitgleich auf dem Computermonitor ein optisches Signal
gegeben. Nach etwa 2 Sekunden in dem schnellen 200-ms Rhythmus wurde
das variable Segment allmählich verlängert, so daß die Gesamtperiode im
Laufe von 25 Sekunden anwuchs bis auf 1000 ms. Dabei wurde weiterhin
zeitgleich mit dem fixen Segment das optische Signal gegeben, so daß das
nun immer seltener vorkommende Segment K trotzdem gut zu verfolgen
war. Dann wurde ein besonderes optisches Signal gegeben, und das
semiperiodische Rauschen (100 ms fix, 900 ms variabel) lief nun noch 4
Perioden weiter ohne visuelles Begleitsignal. Dann folgte mit einer
Wahrscheinlichkeit von 50% ein fünftes Mal das fixe Segment, und
zeitgleich zu diesem Moment ein Fragezeichen auf dem Bildschirm. Abb.
6.6 erläutert den Stimulusaufbau.
auditiv:
visuell:
?
Abb. 6.6: Schematische Erläuterung des Stimulusaufbau im „leichten“ Einzelversuch
von Experiment 8. Das semiperiodische Rauschen beginnt in einem raschen
Rhythmus, der sich dann verlangsamt. Ein visuelles Signal zeigt den Rhythmus an
(kleine graue Quadrate). Wenn ein 1-Hz Rhythmus erreicht ist, wird ein besonderes
visuelles Signal (kleiner schwarzer Balken) gegeben, der signalisiert, daß ab jetzt
keine visuelle Unterstützung mehr erfolgt. Gleichzeitig zu dem Zeitpunkt, an dem
evtl. ein letztes fixes Segment vorkommt (langer grauer Balken), erscheint auf dem
Bildschirm ein Fragezeichen.
Die Aufgabe der Versuchsperson war die gleiche wie vorher: Sie sollte
angeben, ob beim Fragezeichen das konstante Segment da war oder nicht,
konnte aber auch mit „weiß nicht“ reagieren. In einer Sitzung wurden 120
Einzelversuche absolviert, d.h. jedes der 60 Segmente in einem leichten und
einem schweren Einzelversuch, wobei die Reihenfolge der Segmente
zufällig war. Ein leichter Einzelversuch dauerte inklusive der
durchschnittlichen Antwortzeit 10 Sekunden, ein schwerer 35 Sekunden, so
daß eine komplette Sitzung ca. 45 Minuten dauerte. Es wurde feedback
gegeben.
102
Jede Versuchsperson absolvierte 3 solcher Blöcke an verschiedenen Tagen.
Um die Statistik für die in Frage kommenden Segmente zu verbessern,
wurde nach einer Zwischenauswertung im dritten Block die Auswahl der
Segmente auf die 20 besten eingeschränkt, die dafür jeweils dreimal getestet
wurden.
II. Ergebnisse
In Abb. 6.7 sind die Ergebnisse von Experiment 8 dargestellt. Der erste
Block wurde als Training gewertet und nicht ausgewertet. Die Ergebnisse
des zweiten Blocks sind im linken Teilbild dargestellt. Da es darum ging,
solche Segmente herauszufinden, die im leichten Einzelversuch eine gute
Erkennbarkeit aufwiesen, im schweren dagegen nicht, wurde eine
Darstellung gewählt, bei der die Leistung im leichten Einzelversuch über der
im schweren aufgetragen wird. Der Trefferüberschuß (richtige Antworten
minus falsche oder „weiß nicht“ Anworten) wurde getrennt für schwere
(Abszisse) und leichte (Ordinate) Einzelversuche ermittelt. Er kann maximal
19 betragen, da 19 Versuchspersonen an Block 2 teilgenommen hatten und
jedes Segment einmal pro Versuchsperson getestet wurde. Die einzelnen
Segmente sind mit Zahlen von 00 bis 59 gekennzeichnet, die dem Startpunkt
des Segments in der 6-s Gesamtrauschprobe entsprechen (00 = 0.0
Sekunden, 59 = 5.9 Sekunden). Im obigen Sinne waren solche Segmente
ideal, die möglichst weit weg von der Diagonale lagen, wo also der
Unterschied zwischen der Leistung im schweren und im leichten
Einzelversuch möglichst groß ist. 20 solche Segmente wurde für Block drei
ausgewählt, wo sie jeweils dreimal getestet wurden. Hier nahmen alle 20
Versuchspersonen teil, somit war die maximal erreichbare Trefferdifferenz
60.
Aus dem rechten Teilbild von Abb. 6.7 geht hervor, daß Segmente 20 und 53
sehr gut geeignet sind, da sie offensichtlich keine markanten Auffälligkeiten
haben, die zu einer sofortigen Entdeckung in der schweren Aufgabe geführt
hätten, aber mit etwas Hilfestellung ins Echogedächtnis aufgenommen
werden können und dann leicht wiederzuerkennen sind.
6.4.2 Experiment 9: Ereigniskorrelierte Potentiale zu SPR
Beim nun folgenden EEG-Experiment ging es darum, aufzuzeigen, was sich
im EEG verändert, wenn ein ansonsten unauffälliges Segment im
103
Trefferüberschuß im schweren Einzelversuch
Abb. 6.7: Ergebnisse von Experiment 8. Trefferüberschuß im leichten (Ordinate)
bzw. im schweren (Abszisse) Einzelversuch für alle 60 Segmente des zweiten Blocks
(linkes Teilbild) bzw. für die 20 im dritten Block verwendeten Segmente (rechtes
Teilbild). Auf Grund der höheren Statistik im dritten Block sind hier höhere
Trefferüberschüsse möglich. Da Segmente gesucht wurden, die im schweren
Einzelversuch nicht gut abschneiden, im leichten dagegen sehr gut, sind Segmente
20 und 53 am besten geeignet.
Echogedächtnis gespeichert und bei der Wiederholung wiedererkannt wird.
Dafür ist es günstig, daß die ausgewählten Segmente gut, aber nicht perfekt
wiedererkannt wurden, und daß dies auch für die verschiedenen
Versuchspersonen verschieden war. So kann zwischen Versuchspersonen
unterschieden werden, welche die Aufgabe gut, mittel oder schlecht lösen
können. Mit diesem Experiment soll zwischen den folgenden Hypothesen
unterschieden werden:
kognitiver Aktivierungserhalt: Die Wahrnehmung der Perzepte in periodischem
Rauschen beruht auf dem kognitiven Erhalt der Aktivierung einiger der vormals
erregten Elemente. Dabei wird die sensorische Verarbeitung nicht verändert. Es
104
sollten sich daher nur späte, kognitive Potentiale als Anzeichen der Aktivität des
Echogedächtnisses finden lassen.
Sensorische Vorbereitung: Die Elemente, die im Echogedächtnis gespeichert sind, lösen
eine sensorische Vorbereitung aus, so daß bei einer späteren Präsentation diese Elemente einen verstärkten Eingang erfahren und dadurch eine für die Bewußtwerdung
ausreichende Aktivierung auslösen können. Demzufolge müssen sich frühe
sensorische Potentiale als Ausdruck der Aktivität des Echogedächtnisses zeigen.
I. Methodik
A. Versuchspersonen
Die Versuchspersonen waren dieselben wie in Experiment 8. Sie waren über
den Zweck der Untersuchung aufgeklärt und gaben ihr Einverständnis zu der
Untersuchung. Sie wurden darüber aufgeklärt, daß der Versuch auch
abgebrochen werden konnte. Eine Versuchsperson machte davon Gebrauch.
Drei weitere Versuchspersonen nahmen an Pilotuntersuchungen teil, so daß
die Auswertungen sich auf die verbleibenden 16 Versuchspersonen beziehen
(9 weiblich, 7 männlich).
B. Stimuli und Verfahren
Der Stimulus war ähnlich zu dem in Experiment für den leichten
Einzelversuch beschriebenen Stimulus (siehe Abb. 6.5), mit folgenden
Unterschieden: Als festes Segment kam immer entweder Segment 20 (8
Versuchspersonen) oder Segment 53 (8 Versuchspersonen) zum Einsatz. Das
visuelle Signal wurde nicht mehr über den Computer, sondern über LEDs
gegeben, von denen eine auch als Fixierpunkt diente. Nach dem
Sondersignal, das das Erreichen des Endrhythmus anzeigte, wurde das
visuelle Signal nicht ausgesetzt, sondern blinkte noch 20 weitere Zyklen
lang regelmäßig mit. Dabei wurde es meist, aber nicht immer von dem
konstanten Segment begleitet, d.h. manchmal setzte der Rhythmus des
semiperiodischen Rauschens aus in dem Sinne, daß das konstante Segment
durch ein anderes gleichlautes Rauschen ersetzt worden war. Perzeptuell
spricht man von einer Auslassung (im folgenden wird der englische
Ausdruck omission verwendet, um Verwechslungen mit dem „Auslasser“
der Signaldetektionstheorie, s.u., zu vermeiden). Die Aufgabe der
Versuchsperson war, die Anzahl der omissions zu zählen.
Bei jedem der 20 Zyklen in dieser Endphase wurde mit einer Rate von 1:4
zufällig bestimmt, ob er eine omission enthalten sollte. Nach jeder omission
105
folgten mindestens zwei Präsentationen des konstanten Segmentes, so daß
die effektive omission–Rate 1:6 betrug. In einem Block mit 20 Zyklen
konnten entsprechend dieser Regel maximal 6 omissions vorkommen. Der
Fall, daß keine omission vorkommt, wurde allerdings ausgeschlossen. Nach
jedem solchen Block sollten die Versuchspersonen die Zahl der omissions
nennen, und dann wurde ihnen die richtige Zahl genannt. Ein Block dauerte
inkl. Antwortintervall ca. eine Minute.
Die Versuchspersonen absolvierten 40 Blöcke, in denen jeweils 20 relevante
Ereignisse lagen, mithin 800 relevante Ereignisse. Davon waren ca. 130
omissions. Präsentationen direkt nach einer omission wurden nicht als
Standard gezählt, da hier nicht die für die PR-Wahrnehmung typische
Situation der Wiederholung gegeben war. Somit ergaben sich ca. 530
Standardstimuli pro Versuchsperson.
C. EEG-Messung
Die Versuchspersonen saßen in einem bequemen Stuhl in einem elektrisch
abgeschirmten Raum. Von Umgebungsgeräuschen wurden sie durch den
Stimulus selbst abgeschirmt, der 60 dB oberhalb der Schwelle lag.
Das EEG wurde mit Zinnelektroden an 19 Positionen des 10-20 Systems
gemessen: FP1, FP2, F7, F3, FZ, F4, F8, T3, C3, CZ, C4, T3, T5, P3, PZ,
P4, T6, O1, und O2. Das horizontale und vertikale EOG wurde mittels
bipolaren Elektrodenpaaren vom äußeren Kanthus des linken Auges zum
äußeren Kanthus des rechten Auges bzw. von oberhalb und unterhalb des
rechten Auges erhoben. Die Referenzelektrode wurde an der Nase
angebracht. EEG und EOG wurden mit 200 Hz im kontinuierlichen Modus
digitalisiert (Bandpaß 0.1-40 Hz). Die Epochen (Länge 1000 ms, inkl. 100ms baseline vor dem Stimulus) wurden off-line berechnet. Epochen, bei
denen das EOG 50 µV überstieg, wurden von der weiteren Analyse
ausgeschlossen. Dies kam in weniger als 15% der Epochen vor.
Ereigniskorrelierte Potentiale (EKPs) wurden getrennt für Standardstimuli
und omissions berechnet.
D. Verhaltensauswertung
In jedem Block mit nb omissions wurde die von der Versuchsperson
angegebene Anzahl nv der von ihr gezählten omissions festgehalten. Es gab
dementsprechend pro Versuchsperson 40 Wertepaare (nb,nv), entsprechend
106
den 40 Blöcken. Um festzustellen, wie gut die Versuchsperson mit der
Aufgabe zurecht gekommen war, wurde der Korrelationskoeffizient r über
diese 40 Wertepaare ermittelt. Je größer r, desto besser konnte die
Versuchsperson die Aufgabe lösen. Um auch das Entscheidungskriterium
der Versuchsperson zu erfassen, wurde der Bruch q = nv/nw über die 40
Wertepaare gemittelt. Aus diesen beiden Größen (r und q) lassen sich die
beiden Signaldetektionsparameter der Versuchsperson (Treffer-Rate pT und
die Falsch-Alarm-Rate pFA) ableiten, indem festgestellt wird, welche Werte
von pT und pFA zu den beobachteten Werten von r und q geführt hätten. Dies
läßt sich im Prinzip analytisch berechnen, aber das ist vergleichsweise
kompliziert wegen der Randbedingungen, insbesondere der Regel für die
omissions. Es ist einfacher, pT und pFA mittels einer Monte-Carlo Simulation
zu bestimmen. Die Werte von pT und pFA werden im folgenden der besseren
Verständlichkeit halber als Treffer bzw. falsche Alarme bezüglich der omissions und nicht der Standardstimuli ausgedrückt.
Bei der Monte-Carlo Simulation durchlief eine virtuelle Versuchsperson 10000-mal
das Experiment, das je aus 40 Blöcken mit je 20 Einzelversuchen bestand. Die Regel
für die omissions war genau dieselbe wie im Experiment. Die Versuchsperson wurde
durch pT und pFA charakterisiert. Gemittelt über die 10000 Experimente ergaben sich
recht genaue Mittelwerte für die bei dieser Konstellation von p T und pFA folgenden
Werte von r und q. Durch Verändern von p T und pFA wurden r und q verändert, bis
sich die experimentell gefundenen Werte ergaben. Die dazu benötigten Werte für p T
und pFA wurden als Signalentdeckungsparameter der realen Versuchsperson
angenommen.
II. Ergebnisse
A. Verhaltensauswertung
Der mittlere Korrelationkoeffizient war 0.24, und der mittlere Wert für q war
0.9, d.h. die Versuchspersonen zählten im Durchschnitt 10% weniger omissions als wirklich vorhanden waren. Dies entspricht einer Trefferrate (für
omissions) von 54% und einer Falsch-Alarm-Rate von 14%, bzw. einer
Leistung von 70% in einem Paarvergleich. Die Versuchspersonen, die mit
der Aufgabe am besten zurechtkamen, erzielten Korrelationskoeffizienten
von bis zu 0.79, was einer Leistung im Paarvergleich von 90% entspricht,
während diejenigen, die nicht gut mit der Aufgabe zurechtkamen,
Korrelationskoeffizienten erzielten, die mit dem Zufallsniveau vereinbar
sind.
107
Bei dem nun folgenden Extremgruppenvergleich werden die signifikant über
dem Zufallsniveau operierenden Versuchspersonen zu einer guten
Leistungsgruppe zusammengefaßt. Bei der pro Versuchsperson gegebenen
Zahl von Wertepaaren (N=40) sind Korrelationskoeffizienten r>0.24 auf
einem 5%-Niveau signifikant von Null verschieden. Dies traf für 7
Versuchspersonen
zu.
Diese
Gruppe
weist
einen
mittleren
Korrelationskoeffizienten von 0.45 auf. Dies entspricht pT = 0.92 und pFA =
0.31 (Paarvergleich: 80%). Um einen deutlichen Abstand zwischen der
guten und der schlechten Leistungsgruppe zu gewährleisten, wurden in die
schlechte Leistungsgruppe nur diejenigen Versuchspersonen aufgenommen,
die das Kriterium (r>0.24) um die Hälfte verfehlten, also mit r<0.12. Dies
betraf 5 Versuchspersonen. Es ergab sich eine mittlere Leistungsgruppe
(0.12<r<0.24) von 4 Versuchspersonen, die nicht weiter analysiert wurden.
Dabei soll ausdrücklich betont werden, daß diese Einteilung nicht mit
sonstigen Leistungen der Versuchspersonen korreliert, sondern die
individuelle Hörbarkeit der verwendeten Segmente für diese eine
Versuchsperson widerspiegelt.
B. Ereigniskorrelierte Potentiale
Abb. 6.8 zeigt die ereigniskorrelierten Potentiale (EKPs), die durch
Standardstimuli (wenn das Segment also da war) bzw. omissions ausgelöst
werden, im Vergleich für die gute und die schlechte Leistungsgruppe.
Die beiden Kurven für die schlechte Leistungsgruppe (gepunktet bzw.
gestrichelt) fallen fast aufeinander, d.h., für das EKP macht es keinen
Unterschied, ob das konstante Segment präsentiert wurde oder ein anderes.
In beiden Kurven erkennt man ab 190 ms nach Stimulusbeginn eine vor
allem okzipital ausgeprägte Negativität, die sich frontal umkehrt zu einer
Positivität. Es handelt sich sowohl von der Skalpverteilung als auch vom
Zeitpunkt her eindeutig um visuelle Potentiale, die durch die LEDs
ausgelöst werden. Auditive sensorische Potentiale treten regelmäßig früher
auf als visuelle Potentiale. Es ist bemerkenswert, daß die Kurven für die
schlechte Leistungsgruppe vor 190 ms, also dort, wo man auditive
sensorische Potentiale erwarten würde, nicht signifikant von der Nullinie
abweichen.
Die beiden Kurven für die gute Leistungsgruppe (durchgezogene Linien)
zeigen für beide Arten von Stimuli (Standards und omissions) eine deutliche
108
Negativität während der ersten 300 ms, die bei der schlechten
Leistungsgruppe nicht zu finden ist. Diese Negativität wird im folgenden
NLN genannt (für noise-locked negativity, siehe auch die hellgraue
Schattierung in Abb. 6.8). Sie ist am größten über C3/CZ/C4. In Abb. 6.9 ist
die Differenz zwischen den EKPs für die gute und die schlechte
Leistungsgruppe für Standardstimuli dargestellt. Die NLN erstreckt sich
ungefähr bis 300 ms und ist am größten bei 200 ms.
Für die folgenden ANOVA wurde die NLN gemessen als Mittelwert des
Intervalls [180,200] ms (bezogen auf den Start des konstanten Segments).
Die ANOVA berücksichtigte die Variablen Leistung (Gut versus Schlecht),
Stimulusart (Standard versus omission), und Elektrode (C3/CZ/C4). Es
ergab sich ein Haupteffekt der Leistung (F(1,10) = 12.61, p < .005), also
eine stärkere NLN für die gute als für die schlechte Leistungsgruppe. Die
NLN ist also ein Indikator für die Entdeckung der Periodizität.
109
Abb. 6.8: EKPs zu Standardstimuli (zum wiederkehrenden Segment) und omissions
(an dessen Stelle ein Zufallssegment). Mittel über die gute (r > 0.2) und schlechte (r
< 0.1) Leistungsgruppe. Die Potentiale sind im Intervall von -100 bis 900 ms relativ
zum onset des konstanten Segmentes dargestellt.
Bei der guten Leistungsgruppe zeigt sich ein klarer Effekt in Abhängigkeit
von dem Präsentieren des konstanten Segmentes. Im Falle einer omission
findet man eine weitere Negativität bei ca. 395 ms (dunkelgraue
Schattierung in Abb. 6.8) und eine Positivität, die bei 590 ms am größten ist
(mittelgraue Schattierung). Dieser Komplex aus Negativität und Positivität,
im folgenden N-P-Komplex genannt, wurde für die ANOVA ermittelt als
110
Abb. 6.9: Differenz der EKPs von der guten und der schlechten Leistungsgruppe
zum Standardstimulus. Abszisse wie in Abb. 6.8.
Differenz zwischen den mittleren Amplituden der Positivität ([570,610] ms)
und der Negativität ([375,415] ms). Die ANOVA ergab Haupteffekte der
Leistung (F(1,10) = 5.43, p < .042) und der Stimulusart (F(1,10) = 9.38, p <
.012), und eine Interaktion Leistung × Stimulus (F(1,10) = 7.01, p < .024).
Diese Effekte rühren daher, daß der N-P-Komplex von omissions in der
guten Leistungsgruppe hervorgerufen wird. Der N-P-Komplex repräsentiert
die wohlbekannten Komponenten P3 und N2b, die typischerweise von
devianten Stimuli bei repetitiver Stimulation und aufmerksamem Zuhören
ausgelöst werden (Ritter und Ruchkin, 1992). Daß der N-P-Komplex nur bei
der guten Leistungsgruppe vorkommt, ist eine gute nachträgliche
111
Rechtfertigung der verhaltensbasierten Einteilung der Versuchspersonen in
Leistungsgruppen.
6.5 NLN: Aktivierung sensorischer Verarbeitungsstufen
Nimmt man die NLN als Anzeichen der Aktivität des Echogedächtnisses,
dann kann man ausschließen, daß sie einen späten, modalitätsunspezifischen
Prozeß wiedergibt, denn dafür tritt sie zu früh auf. Das konstante Segment
erstreckt sich über 100 ms, und die NLN hat ihren Gipfel schon bei 200 ms
nach Anfang des Segmentes. Da für die Entdeckung der Wiederholung ein
gewisser Anteil der Wellenform präsentiert worden sein muß (sagen wir: 50
ms), tritt die NLN schon 150 ms nach der Übermittlung des notwendigen
Signalanteils auf. Das ist zu früh für ein spätes, kognitives Potential. Auch
ein Zusammenhang mit dem visuellen Stimulus im Sinne einer visuell
getriggerten kognitiven oder sensorischen Aktivität kann wegen des frühen
Zeitpunktes ausgeschlossen werden. Das wird aus dem Vergleich mit dem
visuell evozierten Potential deutlich: Die ersten deutlich sichtbaren visuellen
Potentiale beginnen nach 200 ms, während die NLN nach 300 ms bereits
beendet ist. Da der Zusammenhang mit dem visuellen Signal erlernt werden
mußte und daher kognitiv repräsentiert ist, würden 100 ms noch nicht
einmal ausreichen, um z.B. auch nur das Ende der NLN zu triggern.
Die NLN ist von ihrem Zeitpunkt her eindeutig ein sensorisches Potential.
Sie könnte eine top-down beeinflußte Aktivierung von sensorischen Arealen
zur Verstärkung der auditiven Signalverarbeitung repräsentieren. Dies wäre
eine sensorische Analogie zu der bekannten contingent negative variation
(CNV, Hillyard, 1973), auch als Erwartungspotential bekannt. Solche
Erwartungspotentiale beginnen meist nach Ende des vorhergehenden Reizes
und bauen sich allmählich auf bis zum Eintreten des erwarteten Reizes. Es
ist möglich, daß der Beginn der NLN wie bei einer klassischen CNV am
Ende des vorhergehenden Segmentes liegt. Der Nulldurchgang bei 0 ms
wird durch die baseline Korrektur im Intervall [-100,0] ms erzwungen. Es
kann allerdings auch sein, daß die Versuchsperson die sensorischen Areale
nur um den zu erwartenden Zeitpunkt des nächsten Auftretens des
Segmentes aktiviert. Sie kennt den Zeitpunkt auf Grund des konstanten,
visuell unterstützten Rhythmus und könnte dieses Wissen strategisch nützen.
In diesem Fall müssen bei einem nicht genau bekannten Rhythmus die
112
sensorischen Areale eher und dauerhafter aktiviert werden als bei bekanntem
Rhythmus.
Was könnte in Nachfolgeexperimenten verändert werden, um die
Aussagekraft der Ergebnisse zu erhöhen und die hier gegebene Interpretation
zu überprüfen? Zunächst sollte die blockweise Struktur der Versuche
aufgegeben werden. Das reduziert zwar die Zahl der Einzelversuche, die pro
Zeiteinheit durchgeführt werden können, ermöglicht aber eine Sortierung
der Einzelversuche nach Verhaltensdaten (korrekt/inkorrekt). Um die NLN
mit bekannten Verlaufsformen der CNV besser in Beziehung setzen zu
können, sollte kein vorhersagbarer visuell unterstützter Rhythmus
vorgegeben sein, den die Versuchsperson strategisch nutzen könnte. Dann
sollte sich wie bei der klassischen CNV eine stetige Negativierung auf
hohem Niveau ergeben. Für die CNV ist bekannt, daß diese beim Auftreten
des erwarteten Signals abbricht. Interessant wäre daher der Vergleich, wie
die NLN bei Standardstimuli und omissions endet. Dazu müssen allerdings
omissions und Standardstimuli gleich häufig sein, so daß keine
veränderungsgenerierten Potentiale (N2b, P3) den Vergleich erschweren. Bei
den in Abb. 6.8 vorgestellten Ergebnissen findet sich in den Kurven für die
omissions der angesprochene N-P-Komplex, so daß bei einer
Differenzbildung zwischen guter und schlechter Leistungsgruppe wie in
Abb. 6.9 das Ende der NLN durch den Beginn der N2b überlagert wird und
daher nicht bestimmt werden kann. Das war der Grund dafür, daß in Abb.
6.9 nur die Differenz für die Standardstimuli dargestellt worden ist.
Eine weitere Verbesserungsmöglichkeit besteht darin, daß statt einer
Sortierung der Versuchspersonen in eine schlechte und eine gute
Leistungsgruppe für jede einzelne Versuchsperson ein leichtes und ein
schwieriges Segment getestet wird, so daß die NLN als Unterschied
zwischen verschiedenen Stimulusbedingungen ermittelt wird. Dadurch
vermeidet man die Kritik, daß die Versuchspersonen in den verschiedenen
Leistungsgruppen eventuell jeweils verschiedene Strategien eingesetzt haben
könnten.
6.6 Ein Modell des Echogedächtnisses
Ein Modell, das ursächlich auf einer kognitiven Restaktivierung beruht
(Abb. 6.2c), sollte die sensorische Verarbeitung des Stimulus nicht
113
beeinflussen. In diesem Fall dürfte es nicht zu einer frühen Erregung bei der
guten Leistungsgruppe kommen, da die sensorische Verarbeitung bei der
guten und der schlechten Leistungsgruppe identisch ist. Der Unterschied
würde erst beim Inhalt des langen sensorischen Speichers ansetzen: bei der
guten Leistungsgruppe wird die Aktivität der richtigen Elemente aufrecht
erhalten, und diese sind daher bei der Wiederholung noch aktiv. Bei der
schlechten Leistungsgruppe werden die guten Elemente durch Interferenz
gehemmt und falsche Elemente aktiv gehalten, und daher rufen die sich
wiederholenden Fluktuationen des konstanten Segments keine hinreichende
Aktivierung hervor. Die sensorische Verarbeitung wäre dagegen in beiden
Fällen identisch, und es sollten keine Unterschiede bei den sensorischen
Potentialen auftreten. Auf der Basis der in Experiment 9 erhobenen Daten
kann diese Vorstellung verworfen werden. Die Möglichkeit der Ausnutzung
kognitiver Restaktivierung im Dienste der sensorischen Vorbereitung ist
hingegen denkbar (s.u.).
Wenn man dagegen davon ausgeht, daß das Echogedächtnis bei der PRWahrnehmung sensorische Areale aktiviert, erhebt sich die Frage, warum
dies nur für eine begrenzte Anzahl von Gedächtniselementen möglich ist. In
Abb. 6.2 war ausgeklammert worden, wie die Kapazitätsgrenze zustande
kommt. Man könnte sich vorstellen, daß sie auf irgendeine Weise vom
kurzen sensorischen Speicher bzw. vom Informationstransfer zu diesem
vorgegeben wird. Zwar würden alle vormals aktivierten Elemente über die
Voraussetzungen verfügen, die entsprechenden Strukturen im kurzen
sensorischen Speicher zu aktivieren, aber bedingt durch einen Engpaß („Flaschenhals“) beim top-down Transfer der Informationen würden nur einige
davon tatsächlich eine sensorische Vorbereitung auslösen (siehe Abb. 6.10a).
Diese Vorstellung wirkt angesichts der Übereinstimmung zwischen der in
Kapitel 5 etablierten Kapazität des Echogedächtnisses und der Zeitkonstante
des kurzen sensorischen Speichers suggestiv. Sie wirft aber andererseits
Fragen auf, wodurch dieser Engpaß ausgelöst wird, und warum er mit der
Zeitkonstante des kurzen sensorischen Speichers übereinstimmt. Im Grunde
besitzt sie wenig Erklärungswert.
Im folgenden wird statt dessen der Standpunkt angenommen, daß auch bei
einer sensorischen Vorbereitung die Kapazitätsgrenze durch den langen
sensorischen Speicher vorgegeben wird (Abb. 6.10b). Da die top-down
gesteuerte Aktivierung sensorischer Areale zum Zeitpunkt des
114
a) Vorbereitung +
Flaschenhalsprinzi
p
K
S
S
b) kapazitiv begrenzte Restaktivierung + Vorbereitung
K
S
S
c) rehearsal +
Vorbereitung
K
S
S
Abb. 6.10: Alternative Vorstellungen zur Erklärung der Kapazitätsgrenze bei der
sensorischen Vorbereitung. a) Man kann annehmen, daß grundsätzlich jedes
aktivierte Element auf die vorgeschalteten sensorischen Areale einwirken kann, aber
der Vorbereitungsmechanismus läßt nur eine begrenzte Zahl von Elementen wirksam
werden (Flaschenhalsprinzip). Dies könnte an der Kapazität des kurzen sensorischen
Speichers (KSS) liegen, oder an dem Transfermechanismus, mit dem die frühen
sensorischen Stufen von der Art der zu erwartenden Elemente informiert werden. b)
Die Kapazitätsgrenze könnte durch die Beschränkung der Zahl gleichzeitig kognitiv
aktiver Elemente im langen sensorischen Speicher analog zu Abb. 6.2c gegeben sein.
Eine solche Begrenzung ist wahrscheinlich wie im KZG vorhanden und daher als
Ursache für die Kapazitätsgrenze des Echogedächtnisses sehr plausibel. Als Ursache
für die geringe Kapazität wird Interferenz zwischen gleichartigen Elementen
angenommen. Im Unterschied zu Abb. 6.2c ist hier die Restaktivierung lediglich
Mittel zum Zweck. c) Beim längeren Verfolgen eines periodischen Rauschens,
dessen Periodizität inzwischen entdeckt worden ist, kann als Mechanismus der
Aktiverhaltung ein rehearsal der hörbar gewordenen Perzepte in Frage kommen.
Wiederauftretens des relevanten Signalanteils erfolgen muß, würde sich eine
Beschränkung der im langen sensorischen Speicher haltbaren Information
automatisch auch auf die durch diesen vermittelte Vorbereitung der
sensorischen Areale auswirken. Zunächst wird argumentiert, daß wie in Abb.
6.2c nur eine begrenzte Zahl von Elementen im langen sensorischen
Speicher aktiv gehalten werden kann. Dabei geht es diesmal allerdings nur
um die Voraussetzung zu einer effektiven sensorischen Vorbereitung, nicht
wie in Abb. 6.2c um den Mechanismus der Hörbarwerdung der Perzepte
selbst. Das Argument basiert auf der bereits von Fechner (1860)
formulierten Vermutung, daß schwach aktivierte und daher unbewußt
gebliebene Repräsentationen denselben Gesetzmäßigkeiten genügen wie
stärker aktivierte, bewußt wahrnehmbare Repräsentationen. Diese
Vermutung ist kompatibel mit dem in dieser Arbeit etablierten Befund, daß
es für die noch nicht bewußt wahrgenommenen Fluktuationen bei der PRWahrnehmung eine Kapazitätsgrenze gibt gerade wie bei bewußt
wahrgenommenen Perzepten.
115
Als weiterer Ausgangspunkt dient die Cowansche Vorstellung, daß es keinen
prinzipiellen Unterschied zwischen den Mechanismen des langen
sensorischen Speichers und denen des Kurzzeitgedächtnisses (KZG) gibt.
Dies wird gestützt durch die in dieser Studie herausgearbeiteten
Ähnlichkeiten zwischen der PR-Wahrnehmung und bekannten KZGPhänomenen: Die in Kapitel 4 berichtete Lebensdauer der Information im
Echogedächtnis entspricht den im KZG gemessenen Zeiten bei
unterbleibendem oder verhindertem rehearsal (z.B. Murdock, 1961), und
auch die geringe Kapazität (Kapitel 5) des Echogedächtnisses entspricht der
geringen Kapazität des KZG.
Bei der Hörbarwerdung von Perzepten in periodischem Rauschen spielen
sich also wohl Vorgänge ab, die am ehesten Speichervorgängen im KZG bei
unterbleibendem (oder verhindertem) rehearsal ähneln. Zudem ist rehearsal
von nicht bewußt wahrgenommenen Perzepten kaum vorstellbar. Daher soll
zunächst die Kapazität des KZG ohne rehearsal diskutiert werden. Dabei sei
betont, daß in der Literatur die Kapazität des KZG oft mit dem rehearsal in
Verbindung gebracht wird. Demnach konkurrieren Spurzerfall und
zyklisches Auffrischen der Information. Anderson (1996) vergleicht die
Situation mit der eines Artisten, der rotierende Teller auf Stäben balancieren
soll und wieder beim ersten Stab sein muß, bevor dort der Teller
herunterfällt. Man könnte annehmen, daß im KZG eine große Menge
gleichartiger Information gleichzeitig aktiv sein kann (Lebensdauer ca. 10
Sekunden), daß aber nur ein kleiner Teil davon via rehearsal dauerhaft (> 10
Sekunden) erhalten werden kann. Dem widerspricht eine Reihe von
Befunden zur Interferenz auch ohne rehearsal. So fanden Shepard und
Teghtsoonian (1961) bei einer Liste von 200 dreistelligen Zahlen, daß
bekannte Zahlen vor allem dann richtig erkannt wurden, wenn der Abstand
bis zur erneuten Präsentation sehr klein ist (1-4 Zahlen). Dies ist deutlich
weniger, als aus der Lebensdauer folgen würde. Ein weiteres
Gegenargument ist, daß die Zahl der in der artikulatorischen Schleife
haltbaren Elemente eine Gesamtsprechdauer von unter 2 Sekunden aufweist
(Baddeley, 1986), deutlich weniger als die Lebensdauer nicht aufgefrischter
Information. Die Kapazitätsgrenze des KZG ist im Vergleich zur
Lebensdauer zu klein, um sich aus der Konkurrenz von Zerfall und rehearsal zu erklären. Wahrscheinlich kann von vornherein nur eine begrenzte Zahl
von gleichartigen Elementen ohne Interferenz koexistieren. Diese stehen
dann der rehearsal Schleife zur Verfügung. (Es ist zu beachten, daß es sich
116
hierbei um gleichartige Information handelt. Verschiedenartige
Informationen können im Cowanschen Modell in hoher Zahl gleichzeitig im
KZG aktiv sein, wobei sie nicht automatisch auch im Fokus der
Aufmerksamkeit stehen, s. Abb. 1.3.)
Da beim Vorbereitungsmodell des Echogedächtnisses der lange sensorische
Speicher die relevanten sensorischen Aktivierungen bis zum
Wiederauftreten halten muß, und da anzunehmen ist, daß es dabei wie im
KZG zu Interferenz zwischen gleichartigen Elementen kommt, ergibt sich
für das Echogedächtnis automatisch eine Kapazitätsbegrenzung. Bei dieser
Interpretation wäre die Tatsache, daß die Kapazität für weißes Rauschen in
der Größenordnung der Zeitkonstante des kurzen sensorischen Speichers
liegt, eine zufällige Koinzidenz. – Wenn die Periodizität eines periodischen
Rauschens erst einmal entdeckt worden ist, indem die wiederkehrenden
Fluktuationen hörbare Perzepte ausgelöst haben, kann auch rehearsal ins
Spiel kommen. Dies ist in Abb. 6.10c dargestellt. Wie oben gezeigt wurde,
ist nicht davon auszugehen, daß dieser Vorgang eine zusätzliche
Kapazitätsbeschränkung darstellt, so daß die in Kapitel 5 gefundene
Kapazität weiterhin durch die Menge der unbewußt aktiv haltbaren
Elemente bestimmt wird.
Eine spannende Frage ist, wie man Kapazitätsbeschränkungen durch
Interferenz bei einem nicht bewußt erlebten Gedächtnisvorgang
interpretieren muß. Wäre der Vorgang bewußt, würde man ohne zu zögern
vom begrenzten Fokus der Aufmerksamkeit sprechen. Die Existenz einer
Kapazitätsgrenze für diese vorbewußten Fluktuationen legt das Konzept
eines präattentiven Fokus nahe. Offensichtlich sind ähnliche Mechanismen
am Werk wie beim Aufmerksamkeitsfokus für bewußte Repräsentationen. In
der Konsequenz könnte dies dazu führen, daß die oft vertretene
Gleichsetzung von Aufmerksamkeit und Bewußtsein aufgegeben werden
müßte. Dann würde auch verständlich, wie es dem Echogedächtnis gelingen
kann, „Aufmerksamkeit“ auf ein nicht bewußt erfahrenes Perzept zu richten
und es gegen Interferenz zu schützen.
Was ist es, das die Kapazität für gleichzeitig aktivierte gleichartige
Information wie z.B. die sensorischen Repräsentationen von Fluktuationen
in weißem Rauschen so beschneidet? Ein Mangel an Ressourcen scheint bei
der großen Menge vorhandener Ressourcen unwahrscheinlich. Eine
Eigenschaft
eines
Algorithmus?
Häufig
werden
117
Aufmerksamkeitsphänomene mit Synchronisation neuronaler Erregung in
Verbindung gebracht. Horn und Opher (1996) haben für Systeme chaotisch
gekoppelter Oszillatoren die Frage untersucht, wieviel unterschiedliche Synchronisations-Kodes gleichzeitig koexistieren können, und fanden im
Höchstfall vier verschieden synchronisierte Populationen. Dies entspricht
der Vollberichtsleistung im Sperling-Versuch. Dies könnte auch die
Kapazität des Echogedächtnisses widerspiegeln, wenn sich 130-200 ms
weißes Rauschen auf irgend eine Art und Weise in eine Itemzahl umrechnen
lassen.
Somit sind wir bei einem Modell des Echogedächtnisses angelangt, bei dem
aktivierte Elemente im langen sensorischen Speicher in begrenzter Zahl für
ca. 10 Sekunden aktiv gehalten werden können und zum richtigen Zeitpunkt
den kurzen auditiven Speicher so voreinstellen können, daß der repetitive
Signaleingang nun stärkere, hörbar werdende Aktivierungen auslöst.
Solange noch keine Perzepte bewußt wurden, geschieht dies ohne rehearsal,
aber intentional steuerbar, indem auf Grund einer willentlichen Anstrengung
Interferenz mit nachfolgenden Elementen verhindert wird. Im Unterschied
zum Modell von Abb. 6.2c stellt die Restaktivierung noch nicht selbst den
Mechanismus dar, der für die schwellenüberschreitende Aktivität beim
zweiten Auftreten des Signals sorgt, sondern ist lediglich eine notwendige
Voraussetzung für die sensorische Vorbereitung. Dieses Modell
unterscheidet sich in einigen Punkten von gängigen Vorstellungen des
Gedächtnisses:
 Im Kurzzeitgedächtnis (= aktiviertes Langzeitgedächtnis) sind sehr viele
Zustände auf verschiedenen Verarbeitungsebenen gleichzeitig aktiv, aber
nur wenige davon sind bewußt. Dies entspricht der von Cowan
vertretenen Auffassung, zwischen Aktivierung und Bewußtsein zu
unterscheiden.
 Dabei sind pro Verarbeitungsebene nur wenige Zustände gleichzeitig
aktiv. Weitere Zustände der gleichen Verarbeitungsebene werden durch
die aktiven Zustände im Sinne einer Interferenz gehemmt. Dies ergibt
sich aus der Notwendigkeit, die obige Vorstellung mit den bekannten
Befunden zur Kapazität im Kurzzeitgedächtnis zu verbinden.
 Die Interferenz betrifft auch Aktivierungen, die in ihrer Stärke nicht
ausreichen, um die Schwelle zum Bewußtsein zu überschreiten. Diese
118
Annahme liegt auf der Linie der Fechnerschen Vermutung einer
Äquivalenz zwischen bewußten und unbewußten Zuständen. Sie dient
hier
dazu,
die
bei
der
PR-Wahrnehmung
beobachteten
Kapazitätsphänomene zu erklären.
 Es ist im Sinne einer Art vorbewußter Aufmerksamkeit möglich, die
unbewußt bleibenden Aktivierungen gegen Interferenz zu schützen. Auch
dies ist hier analog zu bewußten Zuständen angenommen und folgt aus
der Möglichkeit der intentional gesteuerten Wahrnehmung langer Zyklen.
 Unbewußt gebliebene Aktivierungen können auf vorgeschaltete Zustände
vorbereitend einwirken und dadurch die Wahrnehmbarkeit beim
Wiederauftreten erleichtern. Dies ist der hier angenommene kausale
Mechanismus der Hörbarwerdung der Perzepte in periodischem
Rauschen.
Die Annahme einer Äquivalenz von bewußten und unbewußten Zuständen
wird hier gestützt durch die beobachtete Ähnlichkeit von Lebensdauer und
Kapazität bei der PR-Wahrnehmung bzw. im Kurzzeitgedächtnis. Auch beim
letzten Punkt (sensorische Vorbereitung) ergeben sich Parallelen zu EEGBefunden bei bewußt wahrgenommenen Perzepten. So ist es
bemerkenswert, daß bei der guten Leistungsgruppe die sensorischen Areale
unabhängig vom Stimulustyp aktiviert wurden. Diese Beobachtung deckt
sich mit einer Studie (Raij, 1997), die eine Aktivierung des auditiven Kortex
auch bei omissions (im Falle gut wahrnehmbarer Standardstimuli)
nachweist. Aus theoretischen Überlegungen heraus hat MacKay (1960)
gefordert, es müsse in vielen Situationen ökonomischer sein, kognitive
Repräsentationen zu den zugrundeliegenden sensorischen Repräsentationen
zurückzutransformieren und Vergleichsoperationen auf der sensorischen
Ebene vorzunehmen. Diese Vermutung wird gedeckt durch experimentelle
Befunde zur Unterdrückung des –Rhythmus in sensorischen Arealen bei
Suchprozessen im KZG für Töne (Kaufman et al., 1992) bzw. für visuell
präsentierte Listen (Williamson et al., 1996), sowie bei Aufgaben zur
mentalen Rotation (Michel et al., 1994).
Die in dieser Arbeit vorgestellten Befunde und Modellvorstellungen konnten
so nur zustande kommen, weil die Verwendung eines unstrukturierten
Stimulusmaterials eine kategoriale Verarbeitung weitgehend ausschloß.
Dadurch war sichergestellt, daß das sensorische Extrem der auditiven
119
Informationsverarbeitungskette angesprochen wurde. Es ist auffällig, daß bei
all dieser Bemühung um Abgrenzung gegen spätere Verarbeitungsstufen sich
dennoch vergleichbare Charakteristika zu kategorialen Speichervorgängen
ergeben haben. Dies legt eine Sichtweise nahe, derzufolge Vorgänge in ganz
verschiedenen Ebenen der Verarbeitung ähnlichen Gesetzmäßigkeiten
genügen und demzufolge wohl auch auf ähnlichen Wirkmechanismen
beruhen.
Sensorische Areale sind bei vielen kognitiven Leistungen eingebunden.
Wenn dies wie im vorliegenden Fall zu einer Wahrnehmungserleichterung
führt, ist es in anderen Paradigmen üblich, von priming zu sprechen. Dies ist
ein ganz eigenes Forschungsfeld, und der nächste Abschnitt stellt
abschließend einige Bezüge der hier vorgestellten Untersuchungen zu
diesem Gebiet her.
6.7 Echogedächtnis, priming und Repräsentation
Laut Anderson (1996) bezeichnet priming „die Verbesserung der
Verarbeitung eines Stimulus als Funktion einer vorherigen Darbietung“. Von
dieser Definition her würde das im vorhergehenden Abschnitt vorgestellte
Modell des Echogedächtnisses als priming bezeichnet werden können. Das
priming wird meist als Verbesserung einer Reaktionszeit gemessen, aber
eine Erhöhung der Detektionswahrscheinlichkeit ist ebenfalls ein übliches
Kriterium. Von perceptual learning grenzt es sich durch die
Geschwindigkeit ab: Meist ist eine einzige Präsentation ausreichend,
während beim perceptual learning durch viele Wiederholungen eine
Verbesserung erreicht wird (z.B. beim Tragen einer Prismenbrille). Daher
bietet sich bei der PR-Wahrnehmung der Begriff des primings eher an. Im
folgenden sollen Gemeinsamkeiten und Unterschiede zu üblichen priming
Paradigmen besprochen werden.
Sehr unterschiedliche Phänomene werden mit dem Begriff des priming
belegt. Der größte Unterschied betrifft die Wahrnehmbarkeit des primes. Bei
einigen Versuchen wird der prime neben dem Zielreiz als nicht zu
beachtender, aber gut wahrzunehmender Reiz dargeboten, bei anderen
Versuchen wird die Wahrnehmbarkeit des prime erschwert oder verhindert
(z.B. masked priming, Forster und Davis, 1994). Wenn der Reiz
wahrnehmbar ist, findet man wochenlange Nachwirkungen für eine große
120
Anzahl gleichzeitig aktiver primes (DeSchepper und Treisman, 1996). Das
Phänomen der PR-Wahrnehmung ähnelt eher Experimenten mit nicht
wahrnehmbaren primes. Daher soll diskutiert werden, inwieweit sich
Charakteristika der PR-Wahrnehmung (Lebensdauer und Kapazität) bei
dieser Art von priming wiederfinden.
In priming Experimenten mit nicht bewußt verarbeiteten Reizen spielt eine
Dynamik in einem Zeitbereich ähnlich dem der PR-Wahrnehmung eine
Rolle: Die Wirkung des primes dauert Sekunden. Oft wird die Dynamik
nicht vollständig vermessen, da in den Paradigmen keine langen Intervalle
zwischen prime und Zielreiz vorgesehen sind. In den untersuchten
Zeitabschnitten werden teilweise Umschlageffekte zwischen positivem und
negativem priming beobachtet. Roth und Roscher (1990) finden eine
Wahrnehmungserleichterung bei periodisch gebotenen unterschwelligen
Reizen bis zu der längsten von ihnen verwendeten Periode von 8 Sekunden.
Während die Dynamik des primings durch unbewußte Reize gelegentlich
thematisiert wird, ist die Kapazität des primings nur bei bewußt
wahrgenommenen Reizen untersucht worden (und für sehr groß befunden
worden: DeSchepper und Treisman, 1996). Bei den hier relevanteren masked
priming Experimenten wird meist ein einziger prime verwendet, so daß
nicht erfaßt wird, ob mehrere primes sich gegenseitig stören, oder wie viele
gleichzeitig in voller Stärke wirksam werden. Ein Problem dabei ist, daß
solche Untersuchungen nur möglich sind, wenn Menge und Dimensionalität
der verwendeten primes hinreichend groß sind. So können kaum mehrere
Richtungen unabhängig geprimt werden, ohne daß sie schon von der Natur
der Sache her interferieren. In Frage käme semantisches priming, da hier
ausreichend viele unabhängige Assoziationen gleichzeitig geprimt werden
könnten.
Umgekehrt läßt sich fragen, inwieweit sich im Zusammenhang mit dem
priming formulierte Vorstellungen auf die PR-Wahrnehmung übertragen
lassen. Priming wird oft als Aktivierung eines bereits existenten Konzepts
(z.B. einer Farbe oder einer Richtung) angesehen. Kann man im Falle der
PR-Wahrnehmung davon sprechen, daß durch das stets neu gewürfelte
Rauschen ein präexistentes Konzept aktiviert wird? Einen Hinweis gibt hier
die partielle Korrelation verschiedener Versuchspersonen, wie sie in
Experiment 1 beobachtet wurde. Die tatsächliche Korrelation der Perzepte
ist dabei noch höher, als man aus Experiment 1 folgern würde: Es wäre
121
keine perfekte Korrelation zu erwarten, selbst wenn alle Versuchspersonen
auf der Basis von exakt denselben präexistenten Kategorien operieren
würden, da die rhythmische Strukturierung der gehörten Perzepte
unterschiedlich sein könnte. Das weiß man aus Experimenten mit zyklischen
Abfolgen von gut wahrnehmbaren Einzeltönen (z.B. Preusser, 1972). Wenn
man bereit ist, nach festen Regeln vorverdrahtete Merkmalsdetektoren wie
in Abschnitt 3.8 besprochen als präexistente Konzepte zu akzeptieren, dann
genügt die PR-Wahrnehmung diesem Kriterium. Vom Wortsinn
(„Vorbereiten“) her jedenfalls trifft priming exakt die Vorgänge, die sich bei
der PR-Wahrnehmung abspielen.
Bei klassischen Gedächtnisexperimenten wird meist nicht eine
Wahrnehmungserleichterung o.ä. gemessen, sondern per recall oder
Erkennung explizit geprüft, ob die Repräsentation noch aktiv ist. Wenn man
die Prüfung auf eine noch aktive Repräsentation des Reizes hingegen
mittelbar vornimmt, z.B. über eine Reaktionszeitverkürzung oder
Wahrnehmungserleichterung, werden auch Phänomene des impliziten
Gedächtnisses zugänglich. Dies ist sowohl für priming Experimente als auch
bei der PR-Wahrnehmung der Fall. Man könnte bei der PR-Wahrnehmung
von einem impliziten sensorischen Gedächtnis sprechen, im Gegensatz zum
expliziten sensorischen Gedächtnis, wie es bei Teilberichtsinstruktionen
abgefragt wird.
Das eigentlich im Hintergrund stehende Konzept ist die Repräsentation des
Reizes. Gedächtnis und priming sind zwei verschieden Aspekte davon: die
Dynamik bzw. die Wirkung. Auf den verschiedenen Ebenen der
Informationsverarbeitung ist der Reiz jeweils verschieden repräsentiert. Auf
der frühesten Stufe könnte man von einer präkognitiven Repräsentation
sprechen. Ein Kennzeichen dieser Stufe ist, daß hierauf keine höheren
kognitiven Prozesse dynamisch einwirken können. Damit sind nicht
Prozesse im Sinne einer allgemeinen Voreinstellung wie z.B. das tuning von
rezeptiven Feldern gemeint. Letztere können durchaus auch auf die
präkognitiven Stufen einwirken. Vielmehr ist der wichtigste Unterschied,
daß die Repräsentationen auf diesen Stufen auch unter günstigsten
Bedingungen nicht willentlich am Leben gehalten werden können, etwa im
Sinne einer Schleife wie die Repräsentationen des Arbeitsgedächtnis. Diese
Repräsentationen zerfallen sehr rasch, in der Regel in weniger als einer
Sekunde. Wenn gelegentlich höherkognitive Spuren ebenfalls rasch
122
zerfallen, liegt das in der Regel daran, daß sie nicht im Fokus der
Aufmerksamkeit liegen. So kann es sein, daß der Aufmerksamkeitsfokus
kapazitiv überfordert ist, oder daß diese Repräsentationen wegen
mangelnder Ausprägung nicht bewußt erfahren werden (z.B. masked priming oder PR-Wahrnehmung). Solche Spuren wären unter günstigeren
Bedingungen (und unter der Voraussetzung, daß sich bewußte und
unbewußte Repräsentationen nicht grundsätzlich unterscheiden) durchaus
länger erhaltbar.
Zu den präkognitiven Speichern zählen die von Cowan zum kurzen
auditiven Speicher gerechneten Phänomene wie Maskierung oder Persistenz
und ihre Analoga beim Sehen. Es ist eine Frage der Terminologie, ob man
solchen Phänomenen das Attribut Gedächtnis zugestehen will. Sie werden
sicherlich nicht als Erinnern erfahren, aber das sollte kein Kriterium sein, da
dies z.B. auch für implizites Gedächtnis gilt.
Eine Sonderstellung nimmt das Paradigma des Teilberichtsvorteils (visuell:
Sperling, 1960) ein. Dabei geht es um eine nachträgliche
Aufmerksamkeitszuwendung
bei
kapazitiver
Überforderung
der
Aufmerksamkeit. Sie ist nur möglich auf der Basis einer noch nicht
zerfallenen präkognitiven Repräsentation. Die mit diesem Paradigma
vermessenen Charakteristika (Lebensdauer, Kapazität) spiegeln nicht
unbedingt die Eigenschaften des zugrundeliegenden Speichersystems
wieder: Es ist möglich, daß neben dem Zerfall der Repräsentation auch
aufmerksamkeitsdynamische Beschränkungen eine Rolle spielen. Als
Beispiel für aufmerksamkeitsdynamische Effekte seien Untersuchungen zum
Aufmerksamkeitswechsel zwischen globalen und lokalen Aufgaben
(Vorberg, 1994) angeführt. Aufmerksamkeit ist ebenso wie der Zerfall ein
dynamischer Prozeß, und bei den im Teilbericht gemessenen Zeiten ist es
schwierig, die beiden Prozesse zu trennen.
Während der visuelle Teilbericht Zeitkonstanten im Bereich der
präkognitiven Speichersysteme liefert, werden für Teilberichtsexperimente
im auditiven Bereich häufig viel längere Zeitkonstanten zitiert (z.B. Darwin
et al., 1972: 4-5 s). Diese Befunde werden zur Zeit eher kritisch gesehen, da
sie sich teilweise nicht reproduzieren lassen und da die methodische
Durchführung nicht ohne Kritikpunkte ist. Andere Studien (Treisman und
Rostron, 1972) kommen auf deutlich kleinere Werte (<1.6 s). Damit nähert
man sich zwar den Zeitkonstanten der präkognitiven Systeme, aber der
123
Abstand ist noch zu groß, um eine eindeutige Interpretation in diese
Richtung hin zuzulassen. Vielleicht erfassen visueller und auditiver
Teilbericht in der Tat Repräsentationen auf unterschiedlichem Niveau.
Auf höheren Verarbeitungsstufen sind die Repräsentationen zum einen
langlebiger und zum anderen kognitiv zugänglich. Das muß nicht heißen,
daß sie bewußt erfahren werden. Periodisches Rauschen ist ein gutes
Beispiel dafür: Im ersten Zyklus hört man die Fluktuation nicht, aber sie
wird in eine wirksame Repräsentation (sensorische Vorbereitung!) überführt.
Dies geschieht für lange Zyklen nicht automatisch, sondern mit definitiver
Willensanstrengung. Es ist faszinierend, sich vor Augen zu halten, was dabei
passiert: Ein Detail der Wellenform wird im Echogedächtnis gespeichert und
gegen Interferenz durch weiteres Rauschen geschützt, obwohl es kein
bewußtes Perzept ausgelöst hat, nur weil man eine Regelmäßigkeit
entdecken will.
Mit kürzeren Zyklen wird das Echogedächtnis von sich aus aktiv: Es bedarf
keiner Aufmerksamkeitszuwendung. Das entspricht Befunden, wonach für
diese Periodizitäten auch bei unbeachteten tonalen Mustern
veränderungssensitive Potentiale im EEG gefunden wurden (Schröger et al.,
1994; Schröger, 1997). Darin spiegelt sich die willkürliche/unwillkürliche
Doppelrolle
der
Aufmerksamkeit
wieder.
Unwillkürliche
Aufmerksamkeitszuwendung sollte aber nicht mit den Automatismen der
präkognitiven Stufe verwechselt werden, da sie nicht wie diese starr
festgelegten Mustern folgt, sondern wesentlich flexibler lernen kann, was
unwillkürliche Aufmerksamkeit erfordert. So ist das Hinhören bei Nennung
des eigenen Namens erlernt, und auch bei den oben zitierten EEG-Befunden
hängt die automatische Zuwendung von dem vorherigen Erlernen eines
Standards ab.
Die hier angeführte Dichotomie in kurzlebige präkognitive und langlebige
kognitive Speichersysteme wird durch die bereits zitierten MEG-Befunde
von Lu et al. (1992) gestützt. Cowans Gedächtnismodell von 1988 ist am
Einspeichermodell orientiert, mit einem Langzeitgedächtnis, darin als
aktivierte Form das Kurzzeitgedächtnis, einiges davon im Fokus der
Aufmerksamkeit. Die kurzen sensorischen Speicher stellt Cowan außerhalb
des Langzeitgedächtnisses als eine eigene Einheit. Dies spiegelt die
präkognitive Stellung dieser Systeme. Es ist schon mehrfach angesprochen
worden, daß die langen sensorischen Register vergleichbare Zeiten ( 10 s)
124
wie das Kurzzeitgedächtnis aufweisen (Murdock, 1961). Das führt zu der
Vermutung gleicher Speichermechanismen für sensorische und kategoriale
Kodes.
Bei dieser Charakterisierung der Repräsentationen ist es offensichtlich, daß
priming auf die Mechanismen der langen sensorischen Speicher und des
Kurzzeitgedächtnisses einwirkt. Bei den präkognitiven Gedächtnissystemen
(wenn man das Wort Gedächtnis überhaupt dafür verwenden will) herrscht
bestenfalls eine Erleichterung im Sinne von Bahnung oder
Informationsintegration vor. Während nun priming im Kurzzeitgedächtnis
häufig untersucht worden ist, ist priming bei weitgehender Verhinderung
kategorialer Kodes („sensorisches priming“) hier zum ersten Mal
thematisiert. Experimente zum kategorialen und sensorischen priming
könnten dabei produktiv aufeinander einwirken. So könnte der Zeitverlauf
beim kategorialen und beim sensorischen priming miteinander verglichen
werden. Kapazität ist, wie schon angesprochen, für kategoriales priming
(mit nicht bewußt wahrgenommenen Reizen) bisher nicht untersucht.
Umgekehrt wäre beim sensorischen priming zu untersuchen, ob außer
perzeptuellem priming auch assoziatives priming auftritt. Dann würde der
Nutzen des Echogedächtnisses sofort weitaus einleuchtender: Es ginge nicht
um das Erinnern des sensorischen Kodes als solchen (evtl. für eine spätere
Re-Interpretation) oder um Wahrnehmungserleichterung bei repetitiven
Reizen, sondern zumindest auch um Wahrnehmungserleichterung bei
assoziativ verwandten Perzepten, z.B. das Ende eines Transienten, wenn der
Anfang bereits verarbeitet ist. Es würde sich sozusagen um eine Art
präkategorialer Assoziationen handeln. Während man allerdings die
Assoziationen kategorialer Stimuli kennt und das Experiment darauf
abstellt, müßte noch überlegt werden, welche Reize präkategorial assoziiert
sein könnten. Letztlich ist dies die Frage nach den jeweils wirksamen
Gestaltgesetzen.
Es ist nichts Ungewöhnliches, daß priming durch Stimuli ausgelöst wird, die
selbst nicht bewußt erfahren werden. So war schon wiederholt das masked
priming (Forster und Davis, 1984) angesprochen worden, wo die vorher
gebotene Maske und der direkt auf den prime folgende Zielreiz die
Wahrnehmung des primes verhindern. Bei periodischem Rauschen findet
solch ein priming durch einen nicht bewußt erfahrenen Reiz ohne großen
methodischen Aufwand, geradezu „natürlicherweise“ statt. Die
125
Fluktuationen, die in periodischem Rauschen leicht und für jedermann
hörbar werden, sind in weißem Rauschen auch geübten Hörern verborgen
(bis auf einen allgemeinen, unbestimmten Eindruck „es fluktuiert“, siehe
auch die Diskussion in Kapitel 6.1). Im Unterschied zu masked priming und
subliminalen primes muß dazu nicht erst eine Schwelle für die jeweilige
Versuchsperson erhoben werden, oder verifiziert werden, daß die gewählten
Intensitäten für die betreffende Versuchsperson in der Tat unbewußt bleiben.
So gesehen stellen Experimente mit periodischem Rauschen ein günstiges
Paradigma für priming Effekte mit nicht bewußt wahrnehmbaren primes dar.
In der Forschung mit periodischem Rauschen als Stimulus stecken ein Reihe
vielversprechender Möglichkeiten. Verbindungen zum priming, zur
Aufmerksamkeitsforschung und zu Paradigmen sensorischen Behaltens,
sowie neue Aspekte wie die Kapazitätsbegrenzung präattentiver
Verarbeitung lassen darauf hoffen, daß von dieser Forschungsrichtung
wertvolle Impulse für ein weitergehendes Verständnis früher sensorischer
Verarbeitung ausgehen.
126
127
Zusammenfassung
Das Teilberichtsparadigma von Sperling wurde von Neisser in seinem Buch
Cognitive Psychology als Indiz für ein sensorisches Register (Ikone) als
notwendige Station der Informationsverarbeitung interpretiert. In
klassischen Gedächtnismodellen wie dem Mehrspeichermodell von
Atkinson und Shiffrin wurden die sensorischen Register als fester
struktureller Bestandteil integriert. Der Informationsfluß zu höheren Stufen
der Informationsverarbeitung sollte durch die Aufmerksamkeit geregelt
werden.
Seit dem einflußreichen Artikel von Haber The impending demise of the icon
wurde dieses Konzept zunehmend kritisiert. Dabei erfuhr allerdings die
Vorstellung des sensorischen Speichers beim Hören, des Echogedächtnisses,
weitaus weniger Kritik als die der Ikone, da der Nutzen im Fall von über die
Zeit verteilter Information weitaus einleuchtender ist. Heute werden die
sensorischen Register nicht als eine obligatorische Station auf dem Weg der
Informationsverarbeitung angesehen. Im Einspeichermodell von Shiffrin
und Schneider werden die sensorischen Register (wie auch das
Kurzzeitgedächtnis) als eine Aktivationsform des Langzeitgedächtnisses
aufgefaßt. Statt eines sensorischen Registers gibt es einen sensorischen
Kode, der gegebenenfalls auch erinnert werden kann.
In letzter Zeit wird, z.B. von Cowan, zusätzlich zu den aktivierten
sensorischen Zuständen des Langzeitgedächtnisses (lange sensorische
Speicher) ein vorgeschaltetes System angenommen, die kurzen sensorischen
Speicher außerhalb des Langzeitgedächtnisses. Im Fall der auditiven
sensorischen Speicher teilt Nelson Cowan die Phänomene kurzfristigen
sensorischen Behaltens wie folgt: Im kurzen auditiven Speicher spielen sich
Phänomene wie Maskierung, Persistenz und Informationsintegration ab, im
langen auditiven Speicher unter anderem Suffixeffekte beim Listenlernen,
nachträgliche Aufmerksamkeitszuwendung beim dichotischen Beschatten,
Teilberichtsparadigmen und die für diese Arbeit wichtige Wahrnehmung
periodischen Rauschens.
Diese Einteilung wird durch MEG-Untersuchungen zu den sensorischen
Spuren, z.B. von Lu et al., bestätigt. Inwieweit Phänomene der kurzen
sensorischen Speicher als Gedächtnis bezeichnet werden, ist auch eine
128
terminologische Frage. Die bewußte Erfahrbarkeit des Gedächtnisprozesses
ist als Kriterium nicht tauglich, da auch beim impliziten Gedächtnis keine
subjektive Erinnerungserfahrung vorliegt.
Die Übergänge zwischen sensorischen Verarbeitungsstufen und
Arbeitsgedächtnis sind fließend. Forschung zu den sensorischen Registern
wird zur Charakterisierung eines Verarbeitungsprozesses auf einem
Kontinuum von Verarbeitungsstufen. Um sich an das sensorische Ende des
Kontinuums zu begeben, muß man mit Stimuli arbeiten, bei denen
möglichst wenig Langzeitinformation ausgenutzt werden kann. Die
vorliegende Arbeit verwendet periodisches weißes Rauschen als minimal
strukturiertes Stimulusmaterial.
Periodisches Rauschen entsteht, wenn man Segmente weißen Rauschens
nahtlos aneinanderhängt. Dabei werden an den Fügestellen keinerlei
Artefakte hörbar, was an der stochastischen Natur von weißem Rauschen
liegt. Wenn die Periode (d.h. die Länge des Segmentes) hinreichend lang
gewählt wurde, hört ein ungeübter Hörer zunächst keinerlei besondere
Struktur. Das periodische Rauschen klingt für ihn wie normales weißes
Rauschen, was demonstriert, daß die Schnittstellen tatsächlich nicht hörbar
sind. Wenn die Periode unter einer Sekunde liegt, wird allerdings für jeden
Zuhörer der Unterschied zu nichtperiodischem Rauschen sofort klar: Man
hört rhythmisch wiederkehrende Perzepte, die von Rauschen zu Rauschen
sehr verschieden sein können, und die bei ein und demselben Rauschen sich
auch von Zuhörer zu Zuhörer unterscheiden können. Guttman und Julesz,
die diesen Stimulus in die Literatur einführten, unterschieden zwei Bereiche:
für Perioden kürzer als 250 ms höre sich das Geräusch wie ein
Außenbordmotor an, für längere Perioden wie ein rhythmisches Hauchen. Je
länger man so einer Rauschprobe zuhört, desto mehr Details hört man
heraus.
Die durchgeführten Untersuchungen konzentrierten sich auf folgende
Aspekte: In Experiment 1-3 wurden Grundphänomene der Wahrnehmung
periodischen Rauschens erfaßt. Dabei ging es um Fragen, die typischerweise
gestellt werden, wenn man diesen Stimulus einem größeren Auditorium
vorspielt: Hören wir jetzt alle dasselbe? Hören wir morgen für dasselbe
Rauschen dasselbe? Was sind die physikalischen Grundlagen im
Rauschsignal, die die Perzepte auslösen? In den Experimenten 4-6 wurden
zwei verschiedene Zeitkonstanten vermessen, die bei diesem Phänomen
129
gleichzeitig aktiv sind und doch eine ganz andere Bedeutung und sehr
verschiedene Werte haben: Lebensdauer und Kapazität der
Echogedächtnisspur, die diese Perzepte hörbar werden läßt. Die Befunde
führen zu Modellen sensorischen Behaltens, zwischen denen nicht mit
Verhaltensexperimenten entschieden werden kann. Daher wurde es
notwendig, die physiologische Basis der Wahrnehmung periodischen
Rauschens mittels elektrophysiologischer Untersuchungen auf der Basis von
evozierten Potentialen näher einzugrenzen. Dazu mußte aber erst eine
geeignete Variante des Stimulus erarbeitet werden, die auch ansonsten von
theoretischem Interesse ist: semiperiodisches Rauschen (Experiment 7 und
8). Das eigentliche EEG-Experiment (Experiment 9) bildet dann den
Abschluß der experimentellen Untersuchungen. Anschließend werden die
theoretischen Konsequenzen diskutiert.
Im ersten Experiment sollte untersucht werden, ob bei späterer Präsentation
derselben Rauschprobe dieselbe rhythmische Struktur gehört wird, und ob es
eine gewisse Korrelation zwischen Versuchspersonen gibt. Zudem sollte die
zum Einsatz kommende Aufgabe validiert werden, das rhythmische
Mittappen zu den gehörten Strukturen.
Der beschriebene Zufallszahlenalgorithmus erlaubt, ein und dieselbe
Rauschprobe bei einer späteren Präsentation exakt wieder zu reproduzieren.
Er wird durch ein Indexsystem gesteuert, und für Experiment 1 kamen neun
Rauschproben, die mit den Indizes 1-9 erzeugt worden waren, zum Einsatz.
Diese wurden als 500 (Probe 1-3), 600 (Probe 4-6) bzw. 700 (Probe 7-9) ms
lange Segmente zyklisch dargeboten, wobei ein zufälliges Stück des ersten
Zyklus weggelassen wurde, um identische Startpunkte zu vermeiden. Neun
Versuchspersonen nahmen an der Studie teil, und um evtl. kulturelle
Zusammenhänge mit untersuchen zu können, waren je drei
Versuchspersonen (2xmännlich, 1xweiblich) aus drei verschiedenen
Nationen (Deutschland, Frankreich, China). Alle Versuchspersonen lebten
zum Zeitpunkt des Experiments seit mindestens einem Jahr in Frankreich
und waren neben ihrer jeweiligen Muttersprache des Französischen und des
Englischen mächtig.
Jede Versuchsperson absolvierte 3 Sitzungen mit je 100 Einzelversuchen,
bei denen zufällig eine der neun Rauschproben unter Vermeidung direkter
Abfolge identischer Proben präsentiert wurde. Die Versuchsperson sollte
zunächst ein paar Sekunden ruhig zuhören, und dann den gehörten
130
Rhythmus tappen. Aus den Tappzeitpunkten konnte später ermittelt werden,
ob die Periodizität richtig erkannt worden war. Das war fast immer der Fall.
Außerdem konnte der Zeitpunkt innerhalb der Periode bestimmt werden, an
dem getappt wurde. Dieser wurde dann pro Versuchsperson und
Rauschprobe histogrammiert. Mittels statistischer Varianzanalysen konnte
gezeigt werden, daß dabei keine Gleichverteilung von Tappzeitpunkten
vorlag, sondern einige wenige (in der Regel 1-2) Tappzeitpunkte allen
anderen Möglichkeiten vorgezogen wurden. Die Korrelation zwischen den
Versuchspersonen lag zwischen 0.2 und 0.7 (Mittelwert 0.43). Dabei waren
selbst die kleinsten Werte signifikant von Null verschieden. Es gab keine
besonders hervorstechende Gruppenstruktur (entsprechend den Nationen
oder dem Geschlecht), mit der Ausnahme einer evtl. vorhandenen engeren
Gruppierung der französischen Versuchspersonen. Eine mögliche
Verbesserung des interkulturellen Vergleichs würde darin bestehen, diese
Untersuchung nicht mit verschiedenen Nationalitäten in einem Land,
sondern in drei verschiedenen Ländern durchzuführen. Außerdem müßte die
Zahl der Teilnehmer deutlich erhöht werden.
Im zweiten und dritten Experiment sollte die physikalische Basis für die
hörbar werdenden Perzepte zeitlich und spektral eingegrenzt werden. Dazu
wurde in Experiment 2 eine einzige Rauschprobe von insgesamt sechs
Sekunden Länge erzeugt und im Speicher des Computers abgelegt. Für die
Einzelversuche wurde dann aus dieser Hauptprobe an zufälliger Stelle ein
kurzes Stück von 400, 600 oder 800 ms Länge herausgeschnitten und als
periodisches Rauschen präsentiert. Wieder wurde (für fünf
Versuchspersonen) der Tappzeitpunkt zu jedem Einzelversuch erhoben. Als
Ergebnis des Experiments konnte eine These verworfen werden, die im
Vorfeld bestanden hatte, daß nämlich ein Perzept, das bei periodischem
Rauschen hörbar wird, aus einer holistischen Interpretation der gesamten
Rauschprobe hervorgeht, auch wenn es selbst einen zeitlich begrenzten
Eindruck hervorruft. Es wurde deutlich, daß für die Wahrnehmung eines
bestimmten Perzeptes nur ein kleiner physikalischer Träger in unmittelbarer
zeitlicher Nachbarschaft (ca. 100 ms) zum Tappzeitpunkt in Frage kommt.
Für die spektrale Eingrenzung (Experiment 3) wurde eine Rauschprobe an
einer zufälligen Stelle in einen Hochpaß– und in einen Tiefpaßteil geteilt,
und diese wurden um ein zufälliges Stück gegeneinander verschoben, bevor
die Rauschprobe wieder zusammengesetzt und den fünf Versuchspersonen
131
präsentiert wurde. Insgesamt gab es fünf Rauschproben, und diese erzeugten
in der Regel eindeutige Tappzeitpunkte. Die Idee war nun, daß wenn der
Schnitt genau in die Gegend des spektrotemporalen Trägers kommt, er das
Perzept zerteilt oder zerstört. Durch eine statistische Analyse der
Tappzeitpunkte in Abhängigkeit von der Schnittfrequenz und des
Verschiebungsbetrages konnte für jedes der 25 Perzepte (5 Rauschproben x
5 Versuchspersonen) ermittelt werden, in welcher spektralen Region es
angesiedelt ist. Es ergaben sich häufig eng umschrieben Bereiche (1/3 bis 1
Oktave ), die für das Perzept zuständig sein mußten. Gelegentlich waren die
Perzepte jedoch über bis zu 2 Oktaven verteilt, oder es kamen auch
Interaktionsperzepte vor, die auf einem gleichzeitigen Vorgang in zwei recht
weit entfernten Frequenzkanälen beruhen. Bei letzteren wurde bei einem
Schnitt zwischen diesen beiden Kanälen der Zeitzusammenhang gestört, und
das Perzept verschwand. Als mögliche Interaktion wird die
Amplitudenkomodulation, wie in letzter Zeit häufig diskutiert,
angenommen. Die Korrelation zwischen Versuchspersonen war wiederum
im mittleren Bereich.
Nachdem nun zumindest für einige Perzepte der Bereich des
Spektrogramms näher eingegrenzt werden konnte, der als physikalischer
Träger des Signals in Frage kommt, lag es nahe, sich diesen Bereich näher
anzuschauen, um die Art der Besonderheit (Energiegipfel o.ä.) verstehen zu
können. Es zeigte sich aber, daß man hier mit physikalischer Signalanalyse
nicht weiterkommt. Zwar findet man in den umschrieben Gebieten
bemerkenswerte Fluktuationen, aber auch an anderen Stellen sind solche
Fluktuationen vorhanden, und man kann aus dem Spektrogramm heraus
nicht vorhersagen, welche Tappzeitpunkte gewählt werden. Überlegungen
zu den möglichen Detektortypen ergaben, daß dies im Grunde auch kaum zu
erwarten ist. Daher wurde im folgenden auf den Ansatz einer physikalischen
Signalanalyse
verzichtet
und
statt
dessen
versucht,
mit
kognitionspsychologischen Methoden die Parameter des Echogedächtnisses
zu erfassen, das die Wahrnehmung der Perzepte ermöglicht.
In den Experimenten 4-6 sollten dazu zwei verschiedene Zeitkonstanten
erfaßt werden. Zunächst (Experiment 4) ging es um die Lebensdauer des
Echogedächtnisses im Falle von weißem Rauschen. Dazu sollte die
maximale Zykluslänge erhoben werden, die noch als periodisch entdeckt
werden kann. In der Originalpublikation von Guttman und Julesz wurde
132
angenommen, daß bei 1-2 Sekunden für den ungeübten Hörer die Grenze
erreicht ist. Spätere Publikationen aus dem Labor von Richard Warren
berichteten informell, daß einige Versuchspersonen mit viel Training bis zu
10 Sekunden lange Perioden als periodisch entdecken. Es war das Ziel von
Experiment 4, zu erheben, mit wieviel Trainingsaufwand welche
Periodenlängen noch erfaßbar sind.
Dazu wurden zwei Versuchspersonengruppen mit je 10 Teilnehmern
gebildet. Keine der Versuchspersonen hatte zuvor je an einem
psychoakustischen Experiment teilgenommen. Gruppe A hörte periodisches
Rauschen mit Perioden, die von 0.5 s im ersten Einzelversuch in kleinen
Schritten zu 20 Sekunden im 22. Einzelversuch anstiegen. In jedem
Einzelversuch sollte die Versuchsperson sich bemühen, den Rhythmus zu
entdecken und durch Mittappen anzuzeigen. Mit einer automatischen und
einer visuellen off-line Analyse wurde dann entschieden, ob sie den
Rhythmus in diesem Einzelversuch korrekt wiedergegeben hat. Wenn die
Versuchsperson bis zu einem bestimmten Zeitpunkt (5 Sekunden plus 7
Zyklen) den Rhythmus nicht entdeckt hatte, wurde der Versuch als
Mißerfolg gezählt und abgebrochen. Insgesamt absolvierten die
Versuchspersonen von Gruppe A den Block aus 22 Einzelversuchen dreimal,
jeweils in aufsteigender Reihenfolge. Bei Gruppe B war es identisch, nur
daß sie in allen drei Blöcken die Einzelversuche in absteigender Reihenfolge
(von 20 s zu 0.5 s) absolvierten.
Als Ergebnis läßt sich festhalten, daß bereits mit sehr wenig Training
(wenige Minuten) beachtliche Periodenlängen erreicht werden. Für Gruppe
A steigerte sich die Leistung über die drei Blöcke von 5 auf 7 Sekunden,
wobei einige wenige Versuchspersonen auch mit 20 Sekunden langen
Zyklen zurecht kamen. In Gruppe B war es ähnlich, nur war der
Trainingserfolg weniger stark: die Leistungen des dritten Blocks waren nicht
sehr von denen des ersten verschieden. Hier ist als Bestleistung
bemerkenswert, daß zwei Versuchspersonen bereits im ersten Block 12
Sekunden lange Perioden korrekt entdecken konnten. Von einem Training
kann man in diesem Fall eigentlich nicht sprechen, da sie keine kürzeren
Perioden zuvor gehört hatten. Diese Leistung beruht somit auf
aufmerksamer Befolgung der Instruktion.
Neben der Lebensdauer des Echogedächtnisses interessiert auch die
Kapazität, wobei sich im Falle weißen Rauschens als operationale
133
Definition diejenige Zeitmenge von Rauschen anbietet, die erinnert werden
kann. Eine naheliegende Verwechslung ist, daß angenommen wird, die
Kapazität betrage 1-2 Sekunden, da dies die von Guttman und Julesz
berichtete Grenze ist. Diese Grenze war in Experiment 4 mit nur wenig
Training auf etliche Sekunden ausgedehnt worden, woraus dann folgen
würde, daß auch die Kapazität sich entsprechend erweitert hätte. Eine
introspektive Beobachtung beim Hören derart langer Rauschzyklen ist
jedoch, daß nur ein äußerst geringer Anteil der Rauschprobe wirklich
erinnert wird. Der größere Teil klingt für die Versuchsperson genauso
unstrukturiert wie normales weißes Rauschen. Um den erinnerten Anteil zu
quantifizieren, wurde in Experiment 5 und 6 während einer fortlaufenden
Präsentation von periodischem Rauschen Segmente der Länge 200, 300 oder
400 ms aus Zyklen der Länge 1.2, 2.4, 4.2 und 6 Sekunden
herausgeschnitten und durch andere ersetzt. Fünf (Experiment 5) bzw. vier
(Experiment 6) Versuchspersonen nahmen an den Experimenten teil. Es war
die Aufgabe der Versuchsperson, zu beurteilen, ob der Zyklus sich geändert
hat. Jede Versuchsperson absolvierte in einer Sitzung 60 Einzelversuche pro
Rauschprobe. Insgesamt wurden vier Konditionen in Experiment 5
(Segmentlänge 300 ms, Zyklus 1.2/2.4/4.2/6 s) und vier weitere Konditionen
in Experiment 6 (Segmentlänge 200/400 ms, Zyklus 2.4/4.8 s) getestet, und
zwar drei– (Experiment 5) bis viermal (Experiment 6) pro Versuchsperson.
Für jede einzelne Sitzung wurde dann mit einer maximum-likelihood
Methode ermittelt, welche der Segmente von der Versuchsperson erinnert
wurden, und welche ausgetauscht werden konnten ohne eine für die
Versuchsperson spürbare Veränderung auszulösen.
Es stellte sich heraus, daß nur ein kleiner Teil der Periode wirklich erinnert
wurde. Der größte Teil des Zyklus konnte ausgetauscht werden, ohne daß die
Versuchsperson etwas davon merkte. Der genaue Betrag ergibt sich aus
Interpolation über die verschiedenen Segmentlängen (400, 300, 200 ms)
gegen Null. Es ergibt sich eine Kapazität des Echogedächtnisses von 130 
130 ms. Dieser Wert war völlig stabil gegenüber Variationen der
Zykluslänge. Daher kann man davon ausgehen, daß hier der Zerfall der Spur
keine Rolle spielt, daß die so gemessene Kapazität also eine genuine
Zeitkonstante des Echogedächtnisses für weißes Rauschen darstellt. Für
andere Stimulusarten, die redundanter sind und sich leichter in kategoriale
Kodes übersetzen, würden sich sicherlich andere Zeitkonstanten ergeben.
134
Die Kapazität von 130 ms repräsentiert das Fassungsvermögen am
sensorischen Ende der Verarbeitungskette.
Die behavioral erhobenen Befunde lassen zwei unterschiedliche
Modellvorstellungen über die Funktion des Echogedächtnisses zu. Das
Entdecken von Fluktuationen im Rauschen, die bei einmaliger Präsentation
nicht hörbar werden, bei wiederholtem Auftreten jedoch schon, könnte an
einem (kapazitiv begrenzten) kognitiven Aktivierungserhalt im langen
sensorischen Speicher liegen, der beim Wiederauftreten zu verstärkter
Aktivität führt. Es könnte jedoch auch eine sensorische Vorbereitung einiger
weniger Elemente im kurzen sensorischen Speicher erfolgen, die dann beim
Wiederauftreten zu einer höheren Aktivierung der entsprechenden Elemente
des langen sensorischen Speichers führt. Diese Frage konnte nicht mit
behavioralen Messungen entschieden werden.
Daher sollte eine EEG-Untersuchung durchgeführt werden. Im Vorfeld dazu
mußte jedoch zunächst nach einer Variante des Stimulus gesucht werden, die
für die Erhebung evozierter Potentiale geeignet ist. Das bisher verwendete
periodische Rauschen ist nicht geeignet, da wegen der Vieldeutigkeit des
Stimulus jede Versuchsperson andere Schwerpunkte hört und die für die
Mittelung der evozierten Potentiale wichtige Information über den Zeitpunkt
des perzeptuellen Ereignisses nicht genau feststeht. Um diesen Zeitpunkt so
genau wie möglich festzulegen, wurde sogenanntes semiperiodisches
Rauschen eingesetzt. Diesen Stimulus erhält man, wenn man nur einen
Bruchteil der Periode wirklich konstant hält, während der Rest der Periode
mit stets neuem, anderem Rauschen aufgefüllt wird. Während periodisches
Rauschen mit Perioden einer Länge von 1 Sekunde immer problemlos als
periodisch wahrgenommen wird, fällt dies bei semiperiodischem Rauschen
deutlich schwerer.
In einer ersten Studie (Experiment 7) wurden aus denselben sechs Sekunden
Rauschen, die auch schon in Experiment 2 verwendet wurden, Segmente der
Länge 200 ms herausgeschnitten und mit variabel gefüllten
Zwischenstücken zu einer Periode von 600 bis 1000 ms ergänzt. Das so
entstandene semiperiodische Rauschen wurde für mindestens 12 Sekunden
dargeboten. Wenn die Versuchsperson bis dahin angefangen hatte, den
Rhythmus mitzutappen, wurde die Präsentation verlängert, bis der getappte
Rhythmus sicher gemessen worden war. Zwei Versuchspersonen
absolvierten jeweils ca. 1000 Versuche. Dann wurde als Funktion der
135
herausgeschnittenen Segmente ermittelt, wie häufig dieses Segment zu einer
erfolgreichen Detektion führte.
Es stellte sich heraus, daß es große Unterschiede zwischen den
verschiedenen Segmenten gibt, wobei einige für beide Versuchspersonen zu
guter Detektion führten, andere hingegen von beiden Versuchspersonen nur
schwer gefunden wurden. Es gab auch Unterschiede zwischen den beiden
Versuchspersonen, aber die Übereinstimmung war deutlich größer als z.B. in
Experiment 1. Das liegt daran, daß bei semiperiodischem Rauschen die
Interpretationsvielfalt eingeschränkt ist. Es geht hier nur noch um die
Merkmalsdetektoren und ihre Fähigkeit, das Wiederkehren dieses Merkmals
zu entdecken.
Bei der gegebenen Variabilität der einzelnen Segmente schien es geraten, für
die 20 Versuchspersonen des EEG-Experimentes genau solche Segmente
auszuwählen, die zwar nicht überauffällig waren, aber mit etwas
Hilfestellung leicht gefunden und behalten werden konnten. Dies geschah in
Experiment 8, das zugleich das Training für Experiment 9 darstellte.
Diesmal kamen 100-ms Segmente (in Zyklen von 1000 ms) zum Einsatz,
um beim EEG-Experiment eine optimale Lokalisation des Zeitpunktes, an
dem das Perzept wahrgenommen wird, zu ermöglichen. Dieselben sechs
Sekunden wurden in 60 Stücke zu je 100 ms zerlegt, und für jedes dieser 60
Stücke wurden pro Versuchsperson 2 verschiedene Einzelversuche
hintereinander absolviert. Der erste Einzelversuch war „schwer“ (ohne
zusätzliche Hilfestellung sollte der Rhythmus gefunden werden), der zweite
war „leicht“ (es wurde mit einem schnelleren, leicht detektierbaren
Rhythmus angefangen, und dieser wurde erst allmählich auf 1 Hz gesenkt;
zusätzlich wurden visuelle Signale gegeben, die das Auffinden des
Rhythmus erleichterten). In beiden Arten von Einzelversuchen war die
Aufgabe dieselbe, nämlich das Beurteilen, ob in der letzten Sekunde des
Stimulus das Segment ebenfalls zugegen war (50%) oder durch ein anderes
ersetzt worden war.
Es ergaben sich tatsächlich große Unterschiede zwischen den Segmenten.
Die erste Sitzung (2x60 Einzelversuche pro Versuchsperson) wurde als
Training gewertet, die zweite (gleicher Aufbau) wurde ausgewertet, um aus
den 60 Segmenten die 20 besten auszusuchen. „Gut“ waren dabei diejenigen
Segmente, die keine besondere Detektierbarkeit im schweren Einzelversuch,
hingegen eine gute Detektierbarkeit im leichten Einzelversuch aufwiesen.
136
Die dritte Trainingssitzung wurde nur mit diesen 20 Segmenten
durchgeführt (aber mit derselben Versuchszahl, also dreimal höhere Statistik
pro Segment). Aus den letzten 20 wurden zwei Segmente bestimmt, die
beide eine Zufallsleistung im schweren Einzelversuch und eine hohe
Leistung im leichten Einzelversuch aufwiesen. Mit diesen beiden
Segmenten wurde dann das EEG-Experiment durchgeführt.
Das EEG-Experiment sollte die Frage klären, ob bei der Tätigkeit des
Echogedächtnisses sensorische Areale aktiviert werden oder nicht. Wenn die
Wahrnehmung periodischen Rauschens auf einer rein kognitiven
Restaktivierung beruht, würde die sensorische Verarbeitung weitgehend
unbeeinflußt von der Detektion einer Periodizität des Rauschens erfolgen.
Nimmt man hingegen an, daß eine Vorbereitung sensorischer Areale erfolgt,
dann müßte sich bei erfolgreicher Detektion von periodischem Rauschen
eine andere sensorische Verarbeitung nachweisen lassen. Es war die Aufgabe
des folgenden Experimentes, diese Frage mittels evozierter Potentiale zu
klären.
Beim EEG-Experiment (Experiment 9) wurde semiperiodisches Rauschen
wie beim „leichten“ Einzelversuch von Experiment 8 zunächst mit einem
schnellen Rhythmus von 5 Hz (200 ms, d.h. 100 ms konstantes Segment,
100 ms variabel) präsentiert, und dieser Rhythmus wurde allmählich im
Lauf von 25 Sekunden durch Verlängern des variablen Teils auf 1 Hz
gesenkt. Der Rhythmus wurde zudem durch blinkende LEDs signalisiert.
Wenn der Rhythmus von 1 Hz erreicht worden war, blinkten Sonder-LEDs
auf, die der Versuchsperson signalisierten, daß jetzt der eigentliche Versuch
beginnt. Die LEDs blinkten dann noch 20-mal in dem selben Rhythmus, und
meist, aber nicht immer, war dabei das konstante Segment zugegen. Wenn es
fehlte (d.h. durch ein anderes Segment ersetzt wurde), entstand das Perzept
einer Auslassung, da das an dieses Segment gekoppelte Perzept wegfiel. Die
Versuchspersonen sollten die Auslasser zählen. Am Ende eines solchen
Blocks nannten sie ihre Zahl und wurden dann über die tatsächliche Zahl der
Auslasser aufgeklärt.
Eine Verhaltensauswertung ergab, daß die Versuchspersonen unterschiedlich
gut mit der Aufgabe zurecht gekommen waren. Dies ist bei der
interindividuellen Variabilität der Wahrnehmung von periodischem
Rauschen nicht verwunderlich. Drei von den 20 Versuchspersonen wurden
zu Pilotversuchen benötigt, eine weitere Versuchsperson machte von ihrem
137
Recht auf Abbruch des Versuchs Gebrauch. Von den verbleibenden 16
Versuchspersonen (7 männlich) wurden entsprechend den Verhaltensdaten
sieben in eine gute Leistungsklasse eingeteilt, vier in eine mittlere, und fünf
in eine schlechte Leistungsklasse. Dabei handelt es sich ausschließlich um
das Zurechtkommen der Versuchspersonen mit dem jeweiligen Segment,
nicht um die allgemeine Leistungsbereitschaft der Versuchspersonen. Die
mittlere Leistungsgruppe wurde nicht ausgewertet. Die gute und die
schlechte Leistungsgruppe wurden miteinander verglichen, und zwar
getrennt für Standardreize (d.h. das Segment war da) und für Auslasser (d.h.
das Segment war ersetzt worden).
Es ergab sich, daß nur bei den guten Versuchspersonen ein Unterschied
zwischen den beiden Stimulusbedingungen zu finden war, und zwar ganz im
Sinne klassischer Deviantpotentiale. Bei den schlechten Versuchspersonen
waren die Kurven für Standards und Auslasser im wesentlichen
deckungsgleich. Das war eine post-hoc Bestätigung der Einteilung der
Versuchspersonen in Leistungsgruppen: die schlechte Leistungsgruppe
zeigte auch nicht die evozierten Potentiale, die die Lösung der Aufgabe
begleiten.
Der wichtige Unterschied zwischen den beiden Leistungsgruppen war, daß
die schlechte Gruppe keinerlei Aktivierung zeitgleich mit dem Stimulus
zeigte (Nullinie), während sich dort bei der guten Leistungsgruppe eine
ausgeprägte Negativität zeigte. Die Versuchspersonen der guten
Leistungsgruppe hatten offensichtlich das relevante Segment erlernen
können und in ihr Echogedächtnis aufgenommen, um dann über das
Echogedächtnis eine sensorische Aktivierung genau im richtigen Zeitpunkt
für die Wiederholung auslösen zu können. Die Versuchspersonen der
schlechten Leistungsgruppe hatten hingegen dieses Segment nicht in ihrem
Echogedächtnis ablegen können und daher konnte dieses nicht die
sensorischen Areale aktivieren.
Die beobachtete Aktivität zeitgleich mit dem Auftreten des Reizes spricht
für die Hypothese, daß bei der Hörbarwerdung der Fluktuationen in
periodischem Rauschen sensorische Aktivität im Sinne einer Vorbereitung
(priming) eine Rolle spielt. Ungeklärt ist hingegen die Frage, wodurch die
Kapazitätsbeschränkung zustande kommt. Man kann sich vorstellen, daß das
Limit vom kurzen sensorischen Speicher vorgegeben wird. Naheliegender
ist jedoch die Vermutung, daß es sich um ein durchgängiges Phänomen der
138
aktivierten Zustände des Gedächtnisses (Einspeichermodell) handelt: Die
Zahl der aktivierten Zustände einer bestimmten Verarbeitungstiefe ist
begrenzt, und weitere Zustände werden im Sinne einer Interferenz gehemmt.
Interessant an dieser Interpretation ist, daß es sich bei den in dieser Arbeit
vorgestellten Befunden um unbewußt ablaufende Prozesse handeln würde,
da die fraglichen Fluktuationen ja beim ersten Auftreten zwar erinnert, aber
noch nicht bewußt bemerkt werden. Dies entspricht der Fechnerschen
Vermutung einer Äquivalenz zwischen bewußten und nichtbewußten
Empfindungen.
Diese
nichtbewußten
Aktivierungen
von
Gedächtniszuständen können gegen Interferenz durch weiteres
Stimulusmaterial geschützt werden. In Konsequenz muß man die Existenz
einer vorbewußten Aufmerksamkeitssteuerung annehmen.
Die Befunde und Modellbildung zum Echogedächtnis ist in dieser Form nur
möglich geworden durch die Verwendung eines weitgehend strukturlosen
Stimulusmaterials. Dadurch war eine kategoriale Verarbeitung und chunk
Bildung weitgehend ausgeschlossen und eine sensorische Speicherung
erzwungen worden. Die sich dabei dennoch einstellende Ähnlichkeit zu
Prozessen kategorialer Speicherung, was Kapazität und Lebensdauer angeht,
ermöglicht eine Integration der Vorgänge sensorischen Behaltens in ein
einheitliches Modell des kurzzeitigen Behaltens.
139
Anhang A: Erzeugung von digitalem Rauschen
Dieser Anhang führt in technische Grundbegriffe zur Schallerzeugung ein,
soweit sie für das Verständnis der vorhergehenden Kapitel benötigt werden.
Es geht um das Digitalisieren einer Wellenform (Anhang A:.A.1), um
digitales weißes Rauschen (Anhang A:.A.2) und periodisches Rauschen
(Anhang A:.A.3). Zuletzt wird der in dieser Arbeit verwendete
Zufallszahlen-Algorithmus erläutert (Anhang A:.A.4).
A.1 Digitalisierte Wellenformen
Eine Schallwelle ist ein kontinuierlicher Vorgang in der Zeit. Für die meisten
Zwecke ist es ausreichend, den Schalldruck zu diskreten Zeitpunkten zu
kennen. Bei der digitalen Musikaufzeichnung wird der Schalldruck 44100
mal pro Sekunde analysiert. Damit können Schwingungen bis zu einer
Frequenz von 22050 Hz festgehalten werden. Da unser Gehör nur
Frequenzen bis 20 kHz hört, gewährleistet dies selbst für hohe Ansprüche
eine gute Schallaufzeichnung. Die in Abb. A. 1 dargestellten Daten
repräsentieren die Mikrophonströme (und damit indirekt den Schalldruck)
eines Musiksignals in Zeitschritten von 1/44100 Sekunden.
Abb. A. 1: Auszug aus der auf CD gespeicherten Wellenform einer auf einem
Musikinstrument gespielten Note. Jede Histogrammsäule repräsentiert den
Mikrophonstrom und damit den Schalldruck zu einem diskreten Zeitpunkt. Diese
Zeitpunkte liegen 1/44100 Sekunde auseinander. Die Digitalisierungsfrequenz ist
hoch genug, denn die Amplituden verändern sich nur allmählich, d.h. es gibt keine
großen Sprünge von einem Zeitpunkt zum nächsten. [Hungarotron HCD 31185,
Gisela Gumz, Clavichord, 120 ms nach dem Onset der Anfangsnote von  (Fuge in
G-Dur von Johann Mattheson, aus „Wohlklingende Fingersprache“).]
140
Statt 44,1 kHz kann auch eine andere Digitalisierungsfrequenz gewählt
werden. Bei den meisten Experimenten wurde eine Frequenz von 20 kHz
gewählt. Dabei muß beachtet werden, daß dann nur Frequenzen bis 10 kHz
repräsentiert werden können, da digitalisierte Wellenformen nur bis zu der
Hälfte der Digitalisierungsfrequenz die originale Wellenform gut
repräsentieren können. Das ist aber für den experimentellen Zweck völlig
ausreichend.
Digitalisierung bedeutet über das Zerlegen der kontinuierlichen Welle in
eine Reihe diskreter Zeitwerte hinaus auch noch Repräsentieren dieser Werte
als digitale Zahl mit einer bestimmten Genauigkeit. Letztere beträgt zur Zeit
bei CDs und den meisten Soundkarten 16 Bit, was eine sehr gute
Genauigkeit garantiert. Auch in der vorliegenden Arbeit wurden alle Stimuli
mit 16 Bit digitalisiert. Im folgenden werden statt der kontinuierlichen
Signale nur noch die digitalisierten Signale besprochen, da alle verwendeten
Stimuli digital erzeugt worden sind.
A.2 Digitales weißes Rauschen
Über Rauschen als auditives Signal ist schon in Kapitel 3.1 gesprochen
worden. Für digitalisiertes weißes Rauschen kann man beweisen, daß die
Zeitwerte voneinander völlig unabhängig sind. Das unterscheidet es von
anderen Signalen wie dem in Abb. A. 1 dargestellten Musiksignal, bei denen
aufeinander folgende Werte einander ähnlich sind. Daher können wir weißes
Rauschen erzeugen, indem wir die aufeinanderfolgenden Amplitudenwerte
zufällig würfeln. Dazu müssen wir nur festlegen, welche Amplitudenwerte
überhaupt möglich sind, und ob sie gleich häufig auftreten sollen oder einer
bestimmten Häufigkeitsverteilung genügen sollen.
In der Technik hat es sich eingebürgert, Gaußsches Rauschen zu verwenden.
Dabei werden die Amplitudenwerte zufällig aus einer Gaußschen Verteilung
gezogen (siehe Abb. A. 2a). Der Grund dafür ist, daß die Amplitudenwerte
von reellem Rauschen, ob es sich um den Teekessel oder um eine Mischung
aus vielen Sprachsignalen handelt, gaußförmig verteilt sind, wie man aus
dem Gesetz der großen Zahl ableiten kann. Künstlich erzeugtes Gaußsches
Rauschen ist also natürlichem weißen Rauschen (z.B. durch Mischen vieler
Sprach- oder Musiksignale erzeugt) am ähnlichsten.
141
Statt einer Gaußverteilung kann man die Werte auch aus einer
Gleichverteilung (Abb. A. 2b) oder aus einer zweiwertigen Verteilung (Abb.
A. 2c) ziehen: für das Hörsystem sind die resultierenden Rauschen nicht zu
unterscheiden. Das liegt daran, daß die an ihrer Wellenform durchaus
unterscheidbaren Signale nach der Aufspaltung auf die verschiedenen
Frequenzkanäle des Innenohrs vergleichbare Amplitudenverteilungen
ergeben, gleich welche Verteilung zuvor vorgelegen hat.
Der nächste Abschnitt behandelt die Folgen dieser Zufälligkeit der
Amplitudenwerte digitalisierten weißen Rauschens: der unkomplizierte
Umgang mit Teilstücken, die in beliebiger Abfolge aneinander gehängt
werden können, eben auch zu periodischem Rauschen. In Abschnitt Anhang
A:.A.4 wird dann der mathematischer Algorithmus für den Zufallsgenerator
spezifiziert, mit dem die in dieser Arbeit verwendeten Rauschstimuli erzeugt
worden sind. Dabei handelt es sich um einen Algorithmus für Gaußsches
Rauschen, da dieser ein Rauschen erzeugt, das physikalisch (auf der Ebene
der Schallwellen) natürlichem Rauschen am ähnlichsten ist. Statt dessen
hätte aber auch ein gleichverteiltes oder binäres Rauschen verwendet werden
können, da diese sich perzeptuell von Gaußschem Rauschen nicht
unterscheiden. Wenn dennoch Gaußsches Rauschen genommen worden ist,
dann liegt das daran, daß es genauso einfach zu erzeugen ist wie
normalverteiltes Rauschen.
A.3 Iteriertes (periodisches) Rauschen
Eine besondere Eigenschaft von digitalisiertem weißen Rauschen ist die
völlige Unabhängigkeit der Amplituden von allen Voramplituden. Dies wird
deutlich, wenn man sich vor Augen hält, daß es durch Würfeln dieser
Amplitudenwerte erzeugt werden kann. Daher kann man digitalisiertes
weißes Rauschen beliebig zerschneiden und zusammenfügen, ohne daß die
Schnittstelle hörbar wird. Um sich das klar zu machen, braucht man sich nur
vorzustellen, diese Operationen statt mit weißem Rauschen mit einer
Zufallszahlenfolge vorzunehmen (denn im Grunde ist digitalisiertes weißes
Rauschen nichts anderes als das): auch dort könnte man z.B. einer Folge das
Herausnehmen der fünften bis zehnten Zahl der Folge nicht „ansehen“.
Wenn man die Originalfolge nicht kennt, gibt es keine Methode, zu
beweisen, daß nach der vierten Zahl etwas fehlt. Genauso kann man eine
142
neue Zufallszahlenfolge zusammenstellen, indem man aus mehreren anderen
Folgen Abschnitte übernimmt und aneinanderhängt.
143
10000
a) Gaußsches Rauschen
5000
0
-5000
-10000
10000
b) gleichverteiltes Rauschen
5000
0
-5000
-10000
10000
c) binäres Rauschen
5000
0
-5000
-10000
Abb. A. 2: a) Die ersten 100 Amplitudenwerte eines Gaußschen Rauschen. Die
Amplitudenwerte dieser Demonstration wurden mit dem in Anhang A:.A.4
behandelten Algorithmus (Index 1) errechnet. Die Standardabweichung wurde auf
der y-Achse auf 3000 gesetzt. Rechts ist die Häufigkeitsverteilung für diese 100
Werte dargestellt (Binweite: 1000). Sie nähert sich einer Gaußschen Verteilung.
Durch die zufällige Wahl der Amplituden ergibt sich ein flaches, weißes Spektrum.
b) Gleichverteiltes Rauschen: die Amplitudenwerte wurden aus einer
Gleichverteilung von -5000 bis 5000 gezogen. Die Varianz ist etwa genauso groß
wie beim Gaußschen Rauschen (5000/3=2887), d.h. das Rauschen ist in etwa
genauso laut. Rechts ist die Häufigkeitsverteilung für die ersten 100 Werte. Auch
dieses Rauschen erzeugt ein flaches Spektrum. c) Noch extremer ist binäres
Rauschen konstruiert. Hier wird zwischen zwei verschiedenen Amplituden zufällig
gewählt. Auch dabei ist das Spektrum flach. Trotz unterschiedlicher Wellenform
klingen alle drei Rauschen gleich.
144
Diese Eigenschaft unterscheidet digitalisiertes weißes Rauschen von allen
anderen digitalisierten Wellenformen: Wenn man z.B. die Wellenform von
Abb. A. 1 verkürzen wollte, müßte man sich genau überlegen, wo man sie
auseinanderschneidet, und wieviel man weglassen will, damit der Übergang
nachher nicht zu hören ist. In der Regel ist dies gar nicht zu bewerkstelligen,
da neben der Grundschwingung auch noch Oberschwingungen eine Rolle
spielen und man nicht für alle beteiligten Frequenzen zugleich einen bruchlosen Übergang gewährleisten kann. Auch rosa oder braunes Rauschen
(siehe Kapitel 3.1) können nicht so problemlos geschnitten werden wie
weißes Rauschen. Wenn man unbedingt besondere spektrale Variante
braucht, empfiehlt es sich, die Schnittoperationen (z.B. die Generierung von
periodischem Rauschen) mit weißem Rauschen vorzunehmen, und dann erst
durch Filtern die gewünschte spektrale Form herzustellen.
Periodisches Rauschen wird erzeugt, indem eine Folge von Zufallszahlen
iteriert wird. Einem derartigen Zyklus läßt sich nicht ansehen, wo er beginnt
bzw. aufhört. Als Beispiel sei ein Zyklus von sechs Zufallsziffern
präsentiert:
485186548518654851865485186548518654851....
Natürlich könnte man einwenden, der Anfang läge offensichtlich bei 4. Aber
vielleicht war die originale Zufallszahlenfolge 5485186, und beim ersten
Zyklus der Präsentation wurde die erste Ziffer weggelassen. Da die Zahlen
keinen inneren Zusammenhang haben, läßt sich nicht nachweisen, wo die
originale Zufallsfolge aufhört und mit der ersten Ziffer neu begonnen wird. –
Zur Erzeugung von semiperiodischem Rauschen (siehe Kapitel 6.3) wird
man einen kurzen Abschnitt einer Zufallsfolge immer wieder in eine andere
Zufallsfolge einbauen. Hier ist natürlich ein Anfang der konstant gehaltenen
Folge nachweisbar, aber nur durch den Vergleich mit den vorhergehenden
Zyklen (und genau das tut das Echogedächtnis).
A.4 Zufallszahlen: Algorithmen
Das in dieser Arbeit verwendete Gaußsche Rauschen wurde mit einer
Familie von Zufallszahlengeneratoren erzeugt, wobei jeder einzelne
Generator durch eine einzige Zahl, den Index, gekennzeichnet ist. Verwendet
man denselben Index, dieselbe Amplitude, Digitalisierungsfrequenz und
145
Periodenlänge, dann kann man dasselbe Rauschen reproduzieren. Mit einem
anderen Index erhält man ein vollständig unabhängiges Rauschen.
Die meisten Zufallszahlengeneratoren erzeugen eine Gleichverteilung von
Werten aus dem Intervall von Null bis Eins. Um Gaußsches Rauschen zu
erzeugen, müssen diese Werte transformiert werden zu Gaußisch verteilten
Werten. Dazu verwendet man im allgemeinen die sogenannte Box-MullerTransformation. Wenn man zwei unabhängige Zufallszahlen X und Y aus
dem Intervall ]0,1] hat, dann erhält man aus diesen zwei normalverteilte
(Mittelwert 0, Standardabweichung 1) Zufallszahlen U und V wie folgt:
U = [2 ln(X) ]½ cos(2Y),
Gl. A.1:
V = [2 ln(X) ]½ sin(2Y).
Üblicherweise wird ein linearer kongruenter Generator eingesetzt. Wenn
man den Modulus M, den Multiplikator A, eine Konstante C und einen
Startwert K0 gewählt hat, folgen weitere Werte für K aus
Gl. A.2:
Kn+1 = (A·Kn + C) mod M.
Wenn man geeignete Konstanten gewählt hat, erhält man gleichverteilte
Zufallszahlen mit 0  K  M. Diese können in das Intervall [0,1[
transformiert werden, indem man sie durch M teilt. Für die Box-MullerTransformation ist es günstiger, Kn+1 durch M+1 zu teilen, da man dadurch
vermeidet, daß in den Logarithmus Null eingesetzt wird.
Die richtige Wahl des Modulus M, des Multiplikators A und der Konstante
C ist alles andere als trivial. Donald E. Knuth (1981) diskutiert die Vorteile
und möglichen Problemquellen von vielen denkbaren Alternativen. Die hier
beschriebenen Zufallszahlengeneratoren sind eng an seinen Ratschlägen
orientiert. Mit Rücksicht auf die Rechengeschwindigkeit wäre es am besten,
M=2b zu wählen, wobei b die Anzahl der Bits des Wortgröße des Computers
ist, da dann die Modulusoperation sehr einfach wäre. Im Hinblick auf die
serielle Unabhängigkeit ist es jedoch vorzuziehen, für M eine Primzahl
auszuwählen. Jeder beliebige Multiplikator ergibt dann die Maximalperiode,
die ersten Dezimalbruchstellen sind genauso „zufällig“ wie die letzten, und
man braucht nicht die „Potenz“ der Zufallszahlenfolge berechnen (ein Maß
für die Unabhängigkeit aufeinander folgender Zahlen), da sie unendlich groß
146
ist. Alle diese Merkmale sind so nur für die Wahl einer Primzahl als
Modulus gültig. Daher wurde dieser Alternative hier der Vorzug gegeben.
Die Rechengeschwindigkeit spielt bei der enorm gestiegenen
Leistungsfähigkeit selbst einfachster Computer heute keine Rolle mehr.
Der Multiplikator sollte größer sein als M, am besten größer als M/100,
aber kleiner als M-M. Die Konstante C sollte so gewählt werden, daß C/M
ungefähr gleich 1/23/6, da dann die serielle Korrelation sehr gering ist.
Alle Berechnungen müssen exakt und ohne Rundungsfehler durchgeführt
werden. Wenn man sich an diese Ratschläge hält, erhält man einen
Generator, der sehr unabhängige Zufallszahlen erzeugt. Im folgenden wird
eine Familie solcher Zufallszahlen definiert, die sich in üblichen
Hochsprachen (FORTRAN, PASCAL, C) implementieren läßt.
Um vollständig unabhängige Zufallsfolgen für die Box-MullerTransformation zu erhalten, werden zwei unabhängige Generatoren für ein
Rauschen definiert:
Kn+1 = (Ak·Kn + Ck) mod Mk.
Gl. A.3:
Ln+1 = (Al·Ln + Cl) mod Ml.
Nun müssen nur noch die Werte K0, Ak, Ck, und Mk sowie L0, Al, Cl, und Ml
definiert werden. Um die Unabhängigkeit zu gewährleisten, sollten die
Moduli Mk und Ml verschieden sein. Sie sollte so groß wie möglich sein, um
eine große Periode zu erhalten. Andererseits sollte A ·M (nach den eben
vorgetragenen Vorschlägen ist das ca. M²/100) noch ohne Rundungsfehler
berechnet werden können. Viele Prozessoren beherrschen 64-Bit Integer
Arithmetik, aber Hochsprachen wie PASCAL stellen keinen Zugang dazu
bereit. Der IEEE Standard für Fließkommazahlen doppelter Genauigkeit
(z.B. DOUBLE PRECISION in FORTRAN) läßt Ganzzahlberechnungen
ohne Rundungsfehler bis 253 zu. Dann kann M so groß sein wie 229, und A
ca. 223 (also  M/64). Die Moduli wurden daher von den Primzahlen unter
229 nach Knuth (1981) gewählt. Um Tippfehler beim Eingeben zu
vermeiden, wurden alle Parameter so gewählt, daß sie sich als simple
Potenzzahlen darstellen lassen. Es ergeben sich folgende Parameter:
147
K0 = 266,
Ak = 245 - i,
Ck = 226,
Mk = 229 - 33,
L0 = K0,
Al = 245 + i,
Cl = Ck ,
Ml = 229 - 43,
Gl. A.4
wobei i der Index für dieses Mitglied der Zufallszahlengeneratorenfamilie
ist. Die unterschiedlichen Multiplikatoren verschiedener Mitglieder dieser
Familie sorgen dafür, daß diese Mitglieder voneinander völlig unabhängig
sind. Kn und Ln werden dann transformiert zu Xn = (Kn + 1) / Mk und Yn =
(Ln + 1) / Ml, und diese entsprechend Gl. A.1 zu Un und Vn. Die
Rauschprobe besteht schließlich aus den Werten U1, V1, U2, V2, .... Uj, Vj,
wo j die halbe Länge des samples ist. Mit denselben Werten für den Index i,
die Länge der Rauschprobe (entspricht 2j), der Digitalisierungsfrequenz, und
der Standardabweichung, mit der die Un und Vn noch multipliziert werden,
kann man genau dieselbe Rauschprobe reproduzieren. Die folgenden Tabelle
führt zu Kontrollzwecken Werte für die ersten zwei Indizes auf.
Index
n
Kn
Ln
Un
Vn
1
1
280718689
407496342
.06451
-1.13695
2
130062562
515535454
1.63167
-.41610
500
351784289
413111291
.11226
-.91262
1
508673792
179541249
-.16618
.28335
2
527791743
452322272
.10142
-.15436
500
184200468
210021800
-1.13400
.92386
2
Tab. A.1: Die Werte von Zufallsfolgen nach Gl. A.1-4 für Kontrollzwecke.
Präsentiert wurde U1, V1, U2, V2, ... nach Multiplikation mit der gewählten
Standardabweichung. Letztere war 10% des höchsten konvertierbaren Wertes
(2151), so daß Überschreitungen des konvertierbaren Bereiches extrem selten
vorkommen sollten. Konvertiert wurden letztlich 211, -3725, 5346, -1363, ... für die
erste Folge.
148
Literaturverzeichnis
Anderson, J.R. (1995). Cognitive Psychology and its Implications. W.H.
Freeman and Company, New York. Deutsche Ausgabe: Kognitive
Psychologie. Spektrum, Heidelberg (1996).
Atkinson, R.C. und Shiffrin. R.M. (1968). Human memory: a proposed system and its control processes. In K.W. Spence und J.T. Spence (Eds.), The
psychology of learning and motivation: advances in research and theory
(Vol. 2, 89-195). Academic Press, New York.
Baddeley, A. (1986). Working memory. Oxford: Oxford University press.
Baddeley A. und Hitch, G. (1974). Working memory. In G.H. Bower (Ed.),
The psychology of learning and motivation (Vol. 8, 47-89). Academic Press,
New York.
Bashford, J.A., und Warren, R.M. (1990). Pattern recognition within spectrally isolated regions of broadband complex sound. Journal of the Acoustical Society of America 87, S24.
Békésy, G. von (1933). Über die Hörsamkeit der Ein- und
Ausschwingvorgänge mit Berücksichtigung der Raumakustik. Annalen der
Physik 16, 844-860.
Bregman, A. (1990). Auditory scene analysis. MIT Press, New York.
Broadbent, D.E., und Ladefoged, P. (1959). Auditory segregation: Stream or
streams? Journal of the Acoustical Society of America 31, 1539.
Broadbent, D.E: (1958). Perception and communication. Pergamon, New
York.
Brubaker, B.S., und Warren, R.M. (1987). Detection of infratonal repetition
of frozen noise: Singularity recognition or pattern recognition? Journal of
the Acoustical Society of America 82, S93.
Brubaker, B.S., und Warren, R.M. (1990). Auditory memory for long-period
random waveforms. Journal of the Acoustical Society of America 87, S24.
Cowan, N. (1984). On short and long auditory stores. Psychological Bulletin
96, 341-370.
149
Cowan, N. (1988). Evolving concepts of memory storage, selective attention, and their mutual constraints within the human information processing
system. Psychological Bulletin 104, 163-191.
Cowan, N. (1995). Attention and memory: An integrated framework. Oxford
University Press, Oxford.
Cutler, A. (1991). Linguistic rhythm and speech segmentation. in Language,
Music, Speech and Brain, edited by Carlson, Nord and Sundberg (MacMillan).
Cutler, A., Mehler, G., Norris, D., Segui, J. (1983). Language-specific comprehension strategy. Nature 304, 159-160.
Darwin, C., Turvey, M., und Crowder, R. (1972). An auditory analog of the
Sperling partial report procedure: Evidence for brief auditory storage. Cognitive Psychology 3, 255-267.
Daugman, J. G. (1980). Two-dimensional spectral analysis of cortical receptive field profiles. Vision Research 20, 847-856.
Daugman, J. G. (1985). Uncertainty relation for resolution in space, spatial
frequency, and orientation optimized by two-dimensional visual cortical
filters. Journal of the Optical Society of America, 2 (7), 1160-1169.
DeSchepper, B. und Treisman, A. (1996). Visual memory for novel shapes:
Implicit coding without attention. Journal of Experimental Psychology:
Learning, Memory, and Cognition 22, 27- 47.
DeValois, R. L. und DeValois, K. K. (1988). Spatial Vision. Oxford University Press.
Ebbinghaus, H. (1885). Über das Gedächtnis. Duckner und Humbold,
Leipzig.
Efron, R. (1970). The minimum duration of a perception. Neuropsychologia
8, 57-63.
Eriksen, C.W. und Collins, J.F. (1967). Some temporal characteristics of
visual pattern perception. Journal of Experimental Psychology 74, 476-484.
Fechner, G.T. (1860). Elemente der Psychophysik. Breitkopf & Härtel, Leipzig.
150
Forster, K.I., und Davis, C. (1984). Repetition priming and frequency attenuation in lexical access. Journal of Experimental Psychology: Learning,
Memory, and Cognition 10, 680-698.
Fowler, C.A. (1979). Perceptual centers in speech production and perception. Perception & Psychophysics 25, 375-388.
Gibson, J.J. (1966). The senses considered as perceptual systems. Houghton
Mifflin, Boston.
Gibson, J.J. (1979). The ecological approach to perception. Houghton Mifflin, Boston.
Glenberg, A.M. (1997). What memory is for. Behavioral and Brain Sciences
20, 1-19.
Guttman, N., und Julesz, B. (1963). Lower limits of auditory periodicity
analysis. Journal of the Acoustical Society of America 35, 610.
Haber, R.N. (1983). The impending demise of the icon: A critic of the concept of iconic storage in visual information processing. Behavioral and
Brains Sciences 6, 1-11.
Hillyard, S.A., (1973). The CNV and human behavior. A review. Electroencephalography and Clinical Neurophysiology Suppl. 33, 161-171.
Horn, D. und Opher, I. (1996). Temporal Segmentation in a Neural Dynamic
System. Neural Computation 8, 375-391.
Kaernbach, C. (1992). On the consistency of tapping to repeated noise,
Journal of the Acoustical Society of America 92, 788-793.
Kaernbach, C. (1993). Temporal and spectral basis of the features perceived
in repeated noise, Journal of the Acoustical Society of America 94, 91-97.
Kaernbach, C. (1998). Lifetime and capacity of echoic memory for random
wave forms, submitted to Perception & Psychophysics
Kaernbach, C., Schröger, E., Gunter, T.C. (1998). Human event-related brain
potentials to auditory periodic noise stimuli, Neuroscience Letters 242, 1720.
151
Kaufman, L., Curtis, S. , Wang, J.-Z., und Williamson, S.J. (1992). Changes
in Cortical Activity When Subjects Scan Memory for Tones, Electroencephalography and clinical Neurophysiology 82, 266-284.
Knuth, D. E. (1981). The Art of Computer Programming, Vol. 2: Seminumerical Algorithms, 2nd ed., Addison-Wesley, Reading, Massachusetts.
Langner, G. (1992). Periodicity coding in the auditory system, Hearing Research 60, 115-142.
Limbert, C. (1984). The perception of repeated noise. Doctoral dissertation,
Cambridge University.
Limbert, C., und Patterson, R.D. (1982). Tapping to repeated noise. Journal
of the Acoustical Society of America 71, R11.
Lu, Z.-L., Williamson, S.J. und Kaufman, L. (1992). Behavioral lifetime of
human auditory sensory memory predicted by physiological measures. Science 258, 1668-1670.
MacKay, D.M. (1960). Theoretical models of space perception. In: C. A.
Muses (Ed.), Aspects of the theory of artificial intelligence. New York, 1960.
MacKay, D.M. (1981). Strife over visual cortical function. Nature 289, 117118.
Marcus, S.M. (1981). Acoustic determinants of perceptual center (P-center)
location. Perception & Psychophysics 30, 247-256.
Michel, C.M. , Kaufman, L., und Williamson, S.J. (1994). Duration of EEG
and MEG alpha Suppression Increases with Angle in a Mental Rotation
Task, Journal of Cognitive Neuroscience 6, 139-149.
Miller G.A. (1956). The magical number seven, plus or minus two: Some
limits on our capacity for processing information. Psychological Review 63,
81-97.
Moore, B.C.J. (1990). Comodulation masking release: spectro-temporal
pattern analysis in hearing. British Journal of Audiology 24, 131-137.
Murdock, B.B. Jr. (1961). The retention of individual items. Journal of Experimental Psychology 62, 618-625.
Neisser, U. (1967). Cognitive psychology. Appleton, New York.
152
Patterson, R.D., Milroy, R., und Lutfi, R.A. (1983). Detecting a repeated
tone burst in repeated noise. Journal of the Acoustical Society of America
73, 951-954.
Pollack, I. (1972). Memory of auditory waveforms. Journal of the Acoustical Society of America 52, 1209-1215.
Pollack, I. (1975). Identification of random auditory waveforms. Journal of
the Acoustical Society of America 58, 126-127.
Pollack, I. (1990). Detection and discrimination thresholds for auditory periodicity. Perception & Psychophysics 47, 105-111.
Preusser, D. (1972). The effect of structure and rate on the recognition and
description of auditory temporal patterns. Perception & Psychophysics 11,
233-240.
Preusser, D., Garner, W.R, und Gottwald, R.L. (1970). Perceptual organization of two-element temporal patterns as a function of their component oneelement patterns. American Journal of Psychology 83, 151-170.
Raij, T., McEvoy, L., Mäkelä, J.P. and Hari, R., (1997). Human auditory
cortex is activated by omissions of auditory stimuli. Brain Research 745,
134-143.
Ritter, W. und Ruchkin, D.S., (1992). Review of event-related potential
components discovered in the context of studying P3. Annals of the New
York Academy of Sciences 658, 1-32.
Roediger, H. L. (1990). Implicit memory: Retention without remembering.
American Psychologist 45, 1043-1056.
Roth, N., und Roscher, G. (1990). A psychophysiological study of perception
and retrieval after repeated "subliminal" stimulation. In: Psychophysical
Explorations of Mental Structure, Ed. H.-G. Geißler, Hogrefe, Stuttgart.
Shepard, R.M. und Teghtsoonian, M. (1961). Retention of information under
conditions approaching a steady state. Journal of Experimental Psychology
62, 302-309.
Schmidt, R.A. (1968). Anticipation and timing in human motor performance. Psychological Bulletin 70, 631-646.
153
Schröger, E. (1997). On the detection of auditory deviations: A pre-attentive
activation model. Psychophysiology, 34, 245-257.
Schröger, E., Paavilainen, P., & Näätänen, R. (1994). Mismatch negativity to
changes in a continuous tone with regularly varying frequencies. Electroencephalography and Clinical Neurophysiology, 92, 140-147.
Schubert, E.D., und West, R.A. (1969). Recognition of repeated patterns: A
study of short-term auditory storage. Journal of the Acoustical Society of
America 46, 1493-1501.
Shiffrin, R.M. und Schneider, W. (1977). Controlled and automatic human
information processing: II. Perceptual learning, automatic attending, and a
general theory. Psychological Review 84, 127-190.
Sperling, G.A. (1960): The information available in brief visual presentations. Psychological Monographs 74, No. 498.
Treisman, A.M. (1960). Contextual cues in selective listening. Quarterly
Journal of Experimental Psychology 12, 242-248.
Treisman, A.M. (1964). Selective attention in man. British Medical Bulletin
20, 12-16.
Treisman, M., und Rostron, A.B. (1972). Brief auditory storage: A modification of Sperling's paradigm. Acta Psychologica 36, 161-170.
Tulving, E. und Schacter, D. (1990). Priming and Human Memory Systems.
Science 247, 301-306.
Uusitalo, M.A., Williamson, S.J., Seppä, M.T. (1996). Dynamical organization of the human visual system revealed by lifetimes of activation traces.
Neuroscience Letters 213, 149-152.
Vorberg, D. (1994). Voluntarily attention switching between global and local
levels. Perception Suppl. 23, 13-14.
Wang, K., und Shamma S. (1994) Wavelet representations of sound in the
primary auditory cortex. Journal of Optical Engineering 33, 2143-2148.
Warren, R.M. (1982). Auditory perception, A new synthesis. Pergamon
Press, Oxford.
154
Warren, R.M., und Ackroff, J.M. (1976). Two types of auditory sequence
perception. Perception & Psychophysics 20, 387-394.
Warren, R.M., und Bashford, J.A. (1981). Perception of acoustic iterance:
Pitch and infrapitch. Perception & Psychophysics 29, 395-402.
Warren, R.M., und Obusek, C.J. (1972). Speech perception and phonemic
restoration. Perception & Psychophysics 9, 358-362.
Warren, R.M., und Wrightson, J.M. (1981). Stimuli producing conflicting
temporal and spectral cues to frequency. Journal of the Acoustical Society of
America 70, 1020-1024.
Warren, R.M., Wrightson, J.M., und Puretz, J. (1988). Illusory continuity of
tonal and infratonal periodic sounds. Journal of the Acoustical Society of
America 84, 1338-1342.
Watkins, O.C. und Watkins, M.J. (1980). The modality effect in free and
serial recall as a function of phonological similarity. Journal of Verbal
Learning & Verbal Behavior 19, 430-447.
Williamson, S.J. , Kaufman, L. , Curtis, S. , Lu, Z-L. , Michel, C.M., und
Wang, J-Z. (1996). Neural Substrates of Working Memories are Revealed
Magnetically by the Local Suppression of Alpha Rhythm, In: Visualization
of Information Processing in the Human Brain: Recent Advances in MEG
and Functional MRI (EEG Suppl. 47), I. Hashimoto, Y.C. Okada, and S.
Ogawa, Eds. Elsevier Science B.V., The Netherlands, pp. 163-180.
Zwislocki, J.J. (1972). A theory of central auditory masking and its partial
validation. Journal of the Acoustical Society of America 52, 644-659.
155
156
Erklärung
Die Habilitationsschrift wurde von mir selbständig verfaßt. Sie benutzt
keine anderen als die angegebenen Hilfsmittel und Quellen. Wörtlich oder
inhaltlich übernommene Stellen sind als solche gekennzeichnet.
157
158
Lebenslauf und wissenschaftlicher Werdegang
4.10.1960 geboren in Bonn. 1978 Abitur Gymnasium Mechernich,
Leistungskurse Physik und Mathematik. 1978/79 Wehrdienst.
Verheiratet seit 1993.
Studium
ab 9/79
ab 4/81
Physik, Universität Bonn. 11/1985 Diplom, Thema: Innenohrmodelle (Betreuer: Prof. Dr. E. de Boer, Amsterdam).
Medizin, Universität Bonn. 6/1988 Approbation. 9/1988
Promotion, Thema: Signalentdeckungstheorie (Prof. Dr. D.
Linke).
Forschung
9/88-8/91 Laboratoire d'Audiologie Expérimentale, Bordeaux (Dr. J.-M.
Aran). Arbeiten über adaptive Methoden in der Psychophysik.
Studien zur Wahrnehmung periodischen Rauschens.
9/91-4/94 Institut für Neuroinformatik, Ruhr-Universität Bochum (Prof.
Dr. C. von der Malsburg). Experimente und Neuromodelle zur
auditiven Gestaltpsychologie und zur Tonhöhenwahrnehmung.
seit 5/94 wiss. Assistent von Prof. Dr. H.-G. Geißler, Institut für
Allgemeine Psychologie, Universität Leipzig.
Experimente/Modelle zu Tonhöhenwahrnehmung, sensorisches
und Kurzzeitgedächtnis.
Lehre
Université Bordeaux 2, UFR des Sciences Sociales et Psychologie:
Mathématiques et Statistiques pour la 1ère année de Psychologie
90/91
Ruhr-Universität Bochum, Fakultät für Psychologie:
Seminar Methoden der Psychophysik SS 93
Seminar Grundlagen der Psychoakustik WS 93
Universität Leipzig, Institut für Allgemeine Psychologie:
Vorlesung Skalierung WS94 WS95 WS96 WS97
Vorlesung Wahrnehmungspsychologie WS94 SS95 WS95 WS96 SS98
Vorlesung Kognitionspsychologie SS96 SS97
Mitarbeit Vorlesung Wahrnehmungstheorie und Psychophysik WS97
159
Mitarbeit Seminar zur Vorlesung SS96 WS96 WS97
Vertiefungsrichtung Kognition SS94 SS96 (WS97 Mitarbeit)
Empirie-Praktikum SS94 - WS97, insgesamt 8-mal, im WS Mitarbeit
160
Veröffentlichungen
in internationalen Zeitschriften mit peer-review System:
de Boer, E., Kaernbach, C., König, P., Schillen, T. (1986). Forward and reverse waves in the one-dimensional model of the cochlea, Hearing Research 23, 1-7.
Kaernbach, C., König, P., Schillen, T. (1987). On Riccati equations describing
impedance relations for forward and backward excitation in the onedimensional cochlea model, Journal of the Acoustical Society of America 81, 408-411.
Kaernbach, C. (1990). A single-interval adjustment-matrix (SIAM) for unbiased adaptive testing, Journal of the Acoustical Society of America
88, 2645-2655.
Kaernbach, C. (1991). Simple adaptive testing with the weighted up-down
method, Perception & Psychophysics 49, 227-229.
Kaernbach, C. (1991). Poisson signal detection theory, Perception & Psychophysics 50, 498-506.
Kaernbach, C. (1992). On the consistency of tapping to repeated noise, Journal of the Acoustical Society of America 92, 788-793.
Kaernbach, C. (1993). Temporal and spectral basis of the features perceived
in repeated noise, Journal of the Acoustical Society of America 94, 9197.
Kaernbach, C., Schröger, E., Gunter, T.C. (1998). Human event-related brain
potentials to auditory periodic noise stimuli, Neuroscience Letters 242,
17-20.
Kaernbach, C. (1998). Clavichord unisons: more than just two strings, Clavichord International 2(1), 14-17.
Kaernbach, C., Demany, L. (1998). Psychophysical evidence against the autocorrelation theory of auditory temporal processing, Journal of the
Acoustical Society of America (akzeptiert)
161
eingereicht, in Vorbereitung:
Kaernbach, C. (1998). Lifetime and capacity of echoic memory for random
wave forms, Perception & Psychophysics (eingereicht).
Kaernbach, C. (1998). Partial report paradigm with visual cues with low and
high contrast, in Vorbereitung.
Kaernbach, C., Neutzler, F. (1998). Data analysis of adaptive data, in
Vorbereitung. Ergebnis einer Diplomarbeit (Betreuer: C. Kaernbach).
Kaernbach, C., Roeber, U. (1998). Search in short-term and long-term
memory. In Vorbereitung. Ergebnis einer Diplomarbeit (Betreuer: C.
Kaernbach).
Qualifikationsarbeiten:
Kaernbach, C. (1985). Stabilität und Auswirkungen von aktiven nichtlinearen
Oszillatoren in einem eindimensionalen Innenohrmodell. Diplomarbeit
(Physik), Bonn.
Kaernbach,
C.
(1988).
Entscheidungsverhalten
an
der
Wahrnehmungsschwelle: Theoretische Überlegungen und ein
Experiment zur klassischen Ja-Nein-Aufgabe. Doktorarbeit in Medizin,
Bonn.
Artikel in Büchern:
de Boer, E., Kaernbach, C., König, P., Schillen, T. (1985). An isolated sound
emitter in the cochlea: Notes on modelling, in Peripheral Auditory
Mechanisms, Ed. J.B. Allen, J.L. Hall, A. Hubbard, S.T. Neely, A. Tubis
(Springer, Berlin), 197-204.
Tagungsbeiträge in proceedings:
Kaernbach, C. (1990). SIAM: Adaptive yes-no task testing with the SingleInterval Adjustment Matrix, in Proceedings of the Sixth Annual Meeting
of the International Society for Psychophysics, Würzburg, 1990, 88-93.
Kaernbach, C. (1991). Neue adaptive Methoden in der Psychophysik, in Fortschritte der Akustik  DAGA 91 (DPG-GmbH, Bad Honnef), 465-468.
162
Kaernbach,
C.
(1991).
Periodisches
Rauschen
und
Periodizitätswahrnehmung, in Fortschritte der Akustik  DAGA 91
(DPG-GmbH, Bad Honnef), 517-520.
Kaernbach, C. (1993). Die Rolle von Onset, Offset und Komodulation bei der
auditiven Szenenanalyse, in Fortschritte der Akustik  DAGA 93 (DPGGmbH, Bad Honnef), 864-867.
Kaernbach, C. (1993). The contribution of onset, offset, and comodulation to
the grouping of noise bands, Journal of the Acoustical Society of America 93, 2347 (Abstract).
Kaernbach, C., Mohlberg, H. (1994). A neural sequence-learning model to
explain auditory periodicity analysis, in Proceedings of the ICANN
1994, Sorrento, Italy. Eds M. Marinaro and P. G. Morasso (Springer,
New York), vol. II, 909-912. Ergebnis einer Diplomarbeit (Betreuer: C.
Kaernbach).
Kaernbach, C. (1996). Zeitkonstanten des Echogedächtnisses, in Fortschritte
der Akustik  DAGA 96, Hg. T. Portele, W. Hess (DEGA e.V.,
Oldenburg), 372-373.
163
164
Einwerbung von Drittmitteln
 DFG-Forschungsstipendium Ka 824/1 „Gefrorenes Rauschen als Mittel
zum Studium der Wahrnehmung von Periodizität bei akustischen
Signalen“, Laboratoire d'Audiologie Expérimentale, Bordeaux, 9/898/91.
 Mitwirkung bei der Konzeption und Projektmitarbeiter (BAT IIa 12/914/94)
im
DFG-Projekt
Ma 697/4
„Psychoakustische
und
neuroinformatische Analyse von auditiven Mechanismen zur
Zeitverarbeitung und Segmentation“ (Antragsteller: Prof. Dr. C. von der
Malsburg, Ruhr-Universität Bochum), Gesamtumfang 300 TDM.
 Mitantragsteller und Organisator der von der DFG (4851/173/95)
unterstützten Tagung “Phenomena and Architectures of Cognitive Dynamics” in Leipzig, 29.6.-1.7.95 (DFG: 30 TDM, insgesamt 60 TDM).
 Anschaffung einer Schallkabine inkl. Ausrüstung am Institut für
Allgemeine Psychologie, Universität Leipzig, aus HBFG-Mitteln mit
DFG-Begutachtung (HBFG 3772-036-207) für 180 TDM.
 Mitarbeit bei der Anschaffung eines 64-Kanal EEG-Gerätes für das
Institut für Allgemeine Psychologie, Universität Leipzig, aus HBFGMitteln mit DFG-Begutachtung (Hauptantragsteller: Prof. Dr. H.-G.
Geißler, HBFG 3772-036-178) für 209 TDM.
 1/97-4/98 DFG-Kleinprojekt Ka 824/4 „Visuelle Wahrnehmung jenseits
des Vollberichts“ mit Versuchspersonengeldern, 1 SHK etc., Gesamtumfang 12 TDM.
 5/98-4/00-... DFG-Projekt Ka 824/5 „Zeitverarbeitung bei der
Tonhöhenwahrnehmung“ im Schwerpunktprogramm „Zeitverarbeitung
im zentralen auditiven System“ mit ½ BAT IIa, Geräte, Reisekosten etc.,
Umfang 130 TDM (1. Antragszeitraum).
165
166
Register
A
Ackroff ...........................................20; 35
Altmann ................................................ 61
Amplitudenkomodulation .............44; 123
Anderson .................................... 108; 112
ANOVA ......................................101; 103
Antizipation .................................. 30f; 88
Arbeitsgedächtnis ...................8; 114; 120
Artefakt ........................... 23; 27; 82; 120
Atkinson ....................................... 5f; 119
Aufmerksamkeit ...5; 8-10; 59; 83-85; 87;
.. 89; 103; 108-110; 114-116; 119; 129
Aufmerksamkeitsfokus . 9; 85; 108f; 114ff
Autokorrelation .............................. 27-29
Autokovarianz ......................................27
B
Baddeley ........................................8; 108
Bahnung ............................................. 116
Bandpaß ...............................................99
Bandpaßrauschen .................................20
baseline ........................................99; 104
Bashford ........................... 13; 19f; 41; 54
Békésy .................................................. 12
beschatten ........................................... 12f
Betonung ..............................................32
Bewußtsein 5; 8ff; 60; 85ff; 107-117; 129
Bias ...................................................... 38
Bit....................................... 63; 132; 136f
Bloch .................................................... 61
Bregman ...............................................21
Breibandrauschen .................................20
Broadbent .......................................20; 83
Brocca .................................................. 61
Brubaker .........................................20; 35
C
chaotisch ............................................109
China ............................................ 23; 121
chunking....................................... 77; 129
Clavichord.......................................... 131
Collins .................................................. 64
contingent negative variation ............. 104
Cowan ............ 7-14; 20; 59f; 77ff; 84-87;
....................... 107-110; 114; 116; 119
Cutler ................................................... 32
D
Darwin ............................................... 115
Daugman .............................................. 48
Davis .......................................... 112; 117
Demany ................................................ 49
DeSchepper ....................................... 112f
Deutschland ................................. 23; 121
Deviant ............................................... 128
dichotisch ............................... 12; 83; 119
Digitalisierung.................. 18; 44; 89; 99;
...................................... 131-135; 138
E
Ebbinghaus........................................... 53
EEG ............. 81; 87-89; 92f; 96; 99; 111;
................................... 115; 121; 126ff
Efron .................................................... 12
Einspeichermodell.......6-9; 116; 119; 129
Energie .......................... 16; 23; 46ff; 123
EOG ..................................................... 99
Epochen ............................................... 99
ereigniskorrelierte Potentiale ...... 88f; 93;
............................................. 99; 101ff
Eriksen ................................................. 64
Erregungszustand ........................... 51; 86
Ersparnismaß ....................................... 53
Erwartungpotential ............................. 104
Evolution.............................................. 10
F
Farbe .............................. 16; 42f; 64; 113
feature Detektoren...............................48f
167
Fechner ........................ 10; 107; 110; 129
Filtermodell ..................................... 8; 83
Fluktuation ..... 29; 56; 81f; 85; 87f; 106f;
.............. 109; 115; 117; 123; 125; 129
Forster ........................................112; 117
Fouriertransformation .................... 41; 44
Fowler ................................................. 32
Frankreich..................... 23; 32f; 121; 122
Fuge ................................................... 131
G
Gabor ................................................... 48
Geißler ................................................. 61
Geschlecht ........................... 22; 32ff; 122
Gestalt ........... 10; 21; 32; 46; 81; 93; 117
Gibson ................................................... 6
Glenberg .............................................. 10
Grenzwertmethode .............................. 55
Gumz ................................................. 131
Gunter .................................................. 92
Guttman ...............12; 14; 18f; 46; 54; 57;
................................59f; 65; 120; 123f
H
Haber ............................................. 5; 119
Habers ................................................... 5
Habituation .................................... 83; 84
Handlung ............................................. 10
HiFi ..................................................... 15
Hillyard ............................................. 104
Hitch ...................................................... 8
Hochpaßrauschen ............. 19; 41-45; 122
holistische Verarbeitung ............. 35f; 122
Horn .................................................. 109
Informationsverarbeitung ........ 5f; 10; 12;
..... 45; 78; 89; 106; 111; 114; 116; 119
Infra-Tonhöhe............................... 13; 19f
Innenohr .......................................16; 133
Interferenz ................. 10; 12f; 20; 53; 85;
....................... 106-110; 113; 115; 129
interindividuelle Unterschiede ..... 34; 44;
.................................................71; 128
J
Julesz ..... 12; 14; 18f; 46; 54; 57; 59f; 65;
...................................... 120; 123; 124
K
Kaernbach ............................................49
Kapazität ..... 5; 51; 59; 63ff; 68; 70f; 73f;
....................... 76ff; 83; 85ff; 106-114;
............................ 116f; 120; 124f; 130
Kaufman ............................................. 111
Klickfolge............................... 18f; 24; 30
Knuth.......................................... 16; 136f
Kode ...........7; 17f; 48; 63f; 78; 109; 116;
............................................... 119; 125
Komodulation...............................46; 123
Konfidenzintervall.............................. 76f
Konsonanten......................................... 11
Konstanzmethode .................................55
konvertieren .................................23; 138
Kurzzeitgedächtnis . 5; 7-10; 13f; 53; 63f;
......... 77; 81; 85; 107f; 110f; 116; 119
Kurzzeitspektrum .................................46
L
I
IEEE .................................................. 137
Ikone.................................. 5; 11; 64; 119
implizites Gedächtnis ......... 10; 113f; 120
Ladefoged ............................................20
Langner ................................................49
Langzeitgedächtnis ............ 7f; 13; 63; 86;
....................................... 110; 116; 119
Lautheit ................................................ 11
Lautstärke .........................................8; 81
168
Lebensdauer ..... 8; 13; 51; 53f; 63ff; 77ff;
.............. 85; 108; 111f; 120; 123f; 130
Limbert ....................... 19f; 21; 27; 34; 46
Listenlernen ................................ 12f; 119
lokale Verarbeitung ......... 34; 36; 40; 115
Lu ........................................... 8; 116; 119
Lutfi...................................................... 19
M
MacKay ........................................ 48; 111
Marcus.................................................. 32
Mattheson ...........................................131
MEG....................................... 8; 116; 119
Mehrspeichermodell ............. 5f; 116; 119
Merkmalsdetektoren .............51; 113; 126
Michel ................................................ 111
Miller ................................................... 63
Milroy .................................................. 19
missing fundamental............................. 18
Modalität ............................................104
Monotonität ........................................ 56f
Moore ................................................... 44
Murdock ...............................13; 108; 116
Musterverarbeitung .............................. 35
Muttersprache................. 22f; 32; 34; 121
N
Nationalität ................................. 23; 121f
Nationalitätengruppe ............................ 23
Neisser................................5; 11; 64; 119
P
PASCAL ............................................ 137
Patterson .................................. 19; 21; 34
Peking .......................................... 23; 121
perceptual learning ............................. 112
Periodotopie ......................................... 49
Persistenz ............................. 11; 114; 119
Pollack ................................................19f
präattentive Verarbeitung ........... 109; 117
Preusser .................................. 20; 35; 113
priming .......... 81; 92; 111-114; 116f; 129
Primzahl ............................................136f
Prismenbrille ...................................... 112
Puretz ................................................... 19
R
Raij..................................................... 111
Reaktionszeit ...............................88; 112f
Redundanz ..................................... 64; 78
rehearsal ................................54; 107-110
Repräsentation .. 10; 13f; 49; 66; 77; 107;
............................... 109; 111; 113-116
Restaktivierung ....87; 105; 107; 110; 127
Retentionsintervall ............................... 20
Ritter .................................................. 103
Roediger ............................................... 10
Roscher .............................................. 112
Rostron............................................... 115
Roth ................................................... 112
Ruchkin .............................................. 103
S
O
Obertöne.......................................18; 135
Obusek ................................................. 20
Oktavband ............................... 19; 44; 46
omission ....................... 98-103; 105; 111
Opher ................................................. 109
Oszillatoren ........................................109
oversampling ........................................47
Schacter................................................ 10
Schmidt ................................................ 31
Schneider ....................................6-9; 119
Schröger ....................................... 92; 115
Schubert ............................................... 20
Schwelle .... 51; 53f; 58; 85f; 99; 110; 117
Selbsterregungsprozeß ......................... 61
semiperiodisches Rauschen ........... 81; 83;
............ 88-95; 98; 121; 126; 128; 135
Shepard .............................................. 108
169
Shiffrin ....................................... 5-9; 119
Signaldetektionstheorie ......... 67; 77; 98ff
Signalentdeckungstheorie .................. 100
Simulation ............................. 69; 72; 100
Singularität ......................................... 35f
Spektrogramm ...... 36; 41; 45-50; 88; 123
Sperling ............. 5; 61; 64; 109; 114; 119
Spurzerfall .......... 8; 20; 54; 78; 108; 114;
.............................................. 119; 125
Steradian .............................................. 64
Störaufgabe.................................... 53; 82
stream .................................................. 20
Suffixeffekte ................................ 12; 119
Sulzer................................................... 61
Synchronisation ..................... 11; 30; 109
Szenenanalyse ..................................... 44
T
Teilbericht ....................... 5; 12f; 64; 114f
Tonhöhe ........................................ 12; 18f
Training ....... 13; 30; 38; 43; 54; 57; 58ff;
........ 70; 74; 82; 91; 93; 96; 123f; 127
Treisman ................... 8; 12; 84; 112f; 115
Tulving ................................................ 10
U
Unterschiedsschwelle .......................... 20
Uusitalo ................................................. 8
V
Vergessenskurve ...................................53
Vollbericht ..........................................109
Vorbereitungsmodell .................. 87; 107f
Vorberg ............................................... 115
vorbewußt................................. 109f; 129
vorsemantisch .......................................83
Vorwärtsmaskierung .............................12
W
Wahrnehmungserleichterung ... 111ff; 116
Warren ................ 13; 19f; 35; 41; 54; 123
Watkins.................................................12
wavelet ............................................... 48f
West......................................................20
Williamson ......................................... 111
Wrightson .............................................19
Z
Zahlenwahrnehmung ............................17
Zeitordnungsgedächtnis........................60
Zufallsklickfolgen ................................ 20
Zufallspunktemuster .......................48; 64
Zufallszahlen .............. 16; 23; 37; 54; 93;
....................... 121; 131; 133; 135-138
Zufallsziffern ......................................135
Zwislocki ..............................................12
Herunterladen