Das Erkennen der Bedeutung einzelner Wörter spielt für das Hauptziel
des Lesens - dem inhaltlichen Verständnis des schriftlichen Materials -
eine zentrale Rolle. Dies wird auch darin deutlich, dass während des Lesevorgangs
ein Wort fixiert und anschließend mittels einer Sakkade zum nächsten
Wort gesprungen wird. Der Lesevorgang ist also zumindest beim geübten Leser
im wesentlichen ein Lesen Wort für Wort (Klicpera & Gasteiger-Klicpera,
1995, S. 13).
Ein faszinierender Effekt, der bereits gegen Ende des 19. Jahrhunderts nachgewiesen
wurde, unterstreicht die Bedeutung des Wortes als schriftsprachliche Einheit:
Cattel beobachtete, dass Buchstaben innerhalb von Wörtern schneller wahrnehmbar
sind als Buchstaben innerhalb von unsinnigen Buchstabenfolgen oder auch Einzelbuchstaben
- ein Phänomen, das von ihm als Wortüberlegenheitseffekt bezeichnet
wurde (Klicpera & Gasteiger-Klicpera, 1995, S. 14 f.). Gegen Ende der 60er
Jahre griff Reicher diesen Effekt wieder auf und untersuchte ihn mittels verbesserter
Forschungsinstrumente erneut. Die Erklärung dieses sowie weiterer untergeordneter
Effekte ist seitdem eines der Prüfkriterien, die an Modelle der visuellen
Worterkennung angelegt werden (Jacobs & Grainger, 1994). Ein weiterer interessanter
Effekt auf diesem Gebiet ist der Stroop-Effekt.
Es existieren zahlreiche solcher Modelle, die sich in Format und Komplexität
wesentlich unterscheiden. Jacobs und Grainger (1994) berichten von insgesamt
15, die im Zeitraum zwischen 1969 und 1994 entstanden sind. Angesichts dieser
Vielfalt möchte ich mich auf einige wesentliche Aspekte beschränken
und deshalb stellvertretend drei verschiedene Modelle herausgreifen, die besonderen
Einfluss auf die Forschung ausgeübt haben und verschiedene Forschungsansätze
repräsentieren. Es handelt sich hierbei um das Logogen-Modell nach Morton
(1969), das Aktivationsmodell nach McClelland und Rumelhart (1981) und die Dual-Route-Theory
nach Coltheart (1978).
Erste Prozessmodelle des Lesens und Schreibens wurden von Morton entwickelt,
der bereits 1969 eine erste Arbeit über den Worterkennungsvorgang beim
Lesen vorgelegt hat (Klicpera & Gasteiger-Klicpera, 1995, S. 97). Er entwickelte
diesen Entwurf weiter und veröffentlichte 1979 sein "Logogen-Modell"
(Graf, 1994, S. 46), welches auch Vorstellungen über die beim Schreiben
ablaufenden Prozesse umfasst (siehe Abb. 2).
|
Viele der Entwürfe, die seitdem entstanden sind, basieren auf Mortons Modell
oder wurden zumindest wesentlich davon beeinflusst (Graf, 1994, S. 46). Da diese
Modelle in der Tradition der Informationsverarbeitungstheorie stehen, folgt
ihre Grobstruktur typischerweise dem Schema "Input -> Verarbeitung ->
Output". Als Input können verschiedene Eingangsinformationen wie z.B.
gesprochene Sprache oder Schrift dienen, die auf diverse lexikalische und nicht-lexikalische
Arten weiterverarbeitet werden. Der Output besteht aus Sprache (beim Lesen)
oder Schrift (beim Schreiben) (Klicpera & Gasteiger-Klicpera, 1995, S. 97
ff.). Logogene sind dabei Spracheinheiten, die den mentalen Repräsentationen
von Wortbedeutungen entsprechen. Erreicht eine bestimmte Information - z.B.
ein bestimmtes Wort - das kognitive System, so wird das zugehörige Logogen
aktiviert. Überschreitet die Aktivierung eine bestimmte Schwelle so kommt
es zur Erkennung des Wortes.
Ähnlich wie in der Dual-Route-Theory nach Coltheart (1978) sieht das Modell
neben lexikalischen Verarbeitungsmöglichkeiten von Wörtern auch die
Umwandlung von Sprache in Schrift über die Phonem-Graphem-Korrespondenzregeln
(GPK-Regeln) vor. Allerdings spielt diese Strategie hier nur eine untergeordnete
Rolle, so Klicpera und Gasteiger-Klicpera (1995, S. 99 f.).
Ein Modell, das in der Lage ist, den Wortüberlegenheitseffekt zu erklären,
und das verschiedene Schwächen früherer Modelle überwindet, wurde
von McClelland und Rumelhart (1981) vorgeschlagen. Sie gehen davon aus, dass
sowohl grundlegende grafische Elemente (Punkte und Striche, aus denen sich Buchstaben
zusammensetzten), als auch Buchstaben und Wörter im Gedächtnis repräsentiert
und in Form eines Netzwerkes organisiert sind. Der Worterkennungsprozess beginnt
mit der Aufnahme der grafischen Elemente. Diese Merkmale führen zu charakteristischen
Aktivierungsmustern im neuronalen Netz: Jene Buchstaben, die den Merkmalen entsprechen
werden mittels exzitatorischer Verknüpfungen aktiviert, die anderen über
inhibitorische Verbindungen gehemmt. Analog führen die Aktivierungsmuster
auf Buchstabenebene wiederum bei Überschreitung eines bestimmten Schwellenwertes
zur Aktivierung des zugehörigen Wortes (siehe Abb. 3).
![]() Abbildung 3 Ablauf der Worterkennung im Aktivationsmodell (McClelland & Rumelhart, 1981) |
Der Wortüberlegenheitseffekt lässt sich nach Christmann und Groeben
(1999) auf der Basis des Aktivationsmodells folgendermaßen erklären:
Die Darbietung eines in ein Wort eingebetteten Buchstabens führt zur Aktivierung
auf allen drei Ebenen, die Darbietung von Non-Wörtern oder einzelnen Buchstaben
hingegen nur auf der Eigenschafts- und Buchstabenebene. Die stärkere Aktivierung
wiederum bedingt eine erleichterte Erkennung.
1989 wurde von Seidenberg und McClelland eine erweiterte Version des Modells
vorgelegt, das "parallel-distributed-processing (PDP) connectionist model".
Es ist vollständig als Netzwerkmodell realisiert und liegt in Form einer
Computersimulation vor (siehe Abb. 4). Das in diesem Modell beschriebene Netzwerk
besteht aus 400 orthographischen Eingangsknoten, 200 sog. "versteckten
Einheiten" ("hidden units") und 460 Ausgangsknoten, die die phonetische
Realisation des geschriebenen Wortes beschreiben. Anders als im Modell von McClelland
und Rumelhart (1981) repräsentiert ein Eingangsknoten nicht mehr einen
einzelnen Buchstaben, sondern ein Buchstaben-Tripel (Coltheart, Curtis, Atkins
& Haller, 1993). Wird ein Wort über das visuelle System aufgenommen,
so aktiviert es alle zugehörigen Tripel des Netzwerks, also im Falle des
Wortes Vater die Tripel "--V", "-Va", "Vat", "ate",
"ter", "er-" und "r--". Da die Eingangsknoten
mit den Knoten in der Schicht der versteckten Einheiten verbunden sind, breiten
sich die Aktivierungsmuster zunächst zur Schicht der versteckten Einheiten
und von dort auf die Schicht der phonologischen Ausgangsknoten aus. Die individuelle
Gewichtung der einzelnen Verbindungen repräsentiert hierbei die Lernerfahrung
des Systems. Da die Ausgangsschicht rückkoppelt, durchläuft das gesamte
System eine größere Anzahl an Zyklen, bis schließlich ein stabiler
Zustand erreicht ist. Die phonologische Realisation des geschriebenen Wortes
wird in der Ausgangsschicht des Netzes repräsentiert. Seidenberg und McClelland
(1989) ließen das System die phonetische Realisation von 2 897 einsilbigen
Wörtern der englischen Sprache lernen, woraufhin es auch für 90% der
Non-Wörter die korrekte Aussprache ermitteln konnte. Das PDP-Modell sieht
zusätzlich die Aktivierung von Wortbedeutungen sowohl mittels der phonologischen
als auch der grafischen Realisation eines Wortes vor (siehe Abb. 5). Seidenberg
und McClelland (1989) gehen davon aus, dass Wortbedeutungen ähnlich wie
phonetische Realisationen von Wörtern in einem Netzwerk organisiert sind
und über zwischengeschaltete Schichten von versteckten Einheiten aktiviert
werden können. Allerdings konnten diese Teile des Modells bislang nicht
empirisch bestätigt werden.
|
|
| Abbildung 4 Skizze des am Computer modellierten neuronalen Netzes von Seidenberg & McClelland (1989), aus: Coltheart, Curtis, Atkins & Haller (1993). |
Abbildung 5 Gesamtkonzept des "parallel-distributed-processing-model" (nach Seidenberg & McClelland, 1989). Bislang wurden nur die blau gefärbten Teile des Modells implementiert. |
Eine der prominentesten Theorien der visuellen Worterkennung ist sicherlich
die Zwei-Wege-Theorie oder "Dual-Route-Theory", die erstmals von Coltheart
(1978) vorgeschlagenen wurde und seitdem Gegenstand vielfältiger Publikationen
war. Sie steht nicht nur in Einklang mit zahlreichen neurologischen Erkenntnissen
aus dem Bereich der erworbenen Dyslexie, sondern hat auch die Forschung nach
Subgruppen der Lese-Rechtschreibstörung wesentlich befruchtet (siehe z.B.
Morris et al., 1998; Stanovich, Siegel, Gottardo, Chiappe, & Sidhu, 1997;
Fletcher et al. 1997).
Die Zwei-Wege-Theorie beschreibt zwei mögliche Verarbeitungsmechanismen
im Lese-Prozess (Coltheart & Rastle, 1994) - einen direkten, lexikalischen
und einen indirekten, non-lexikalischen. Der erste, direkte Weg besteht gemäß
dieser Theorie in einer orthographischen Kodierung des Schriftbildes, über
den direkt ein Eintrag im mentalen Lexikon aktiviert wird. Die Aussprache des
Wortes ist also unmittelbar zugänglich. Bei Wörtern, die nicht im
Lexikon vertreten sind, wird hingegen die zweite, indirekte Route gewählt.
Da hier keine Eintragung im Lexikon vorliegt, muss das Wort über die Graphem/Phonem-Zuordnung
Buchstabe für Buchstabe erlesen werden. Die phonologische Struktur eines
Wortes wird also mittels phonologischer Rekodierung von Buchstaben bzw. Buchstabengruppen
seriell rekonstruiert.
Neurologen berichten immer wieder von Patienten, bei denen aufgrund einer hirnorganischen
Schädigung eine dieser beiden Routen nicht verfügbar ist. Diese Studien
zeigen, dass beide Strategien für das Lesen und Schreiben essentiell wichtig
zu sein scheinen. Ist nur der direkte Weg möglich, so haben betroffene
Menschen immense Schwierigkeiten beim Erlesen von Pseudowörtern (Klicpera
& Gasteiger-Klicpera, 1995, S. 193). Da solche Wörter inhaltsfrei sind,
können sie nicht im semantischen Gedächtnis präsent sein. In
diesem Fall kommt es zu einer phonologischen Dyslexie. Es ist allerdings theoretisch
möglich dieses Defizit der Graphem/Phonem- und Phonem/Graphem-Zuordnung
durch ein hinreichend umfassendes semantisches Gedächtnis zu kompensieren,
da Pseudowörter im Alltag nur eine untergeordnete Rolle spielen. Auf diese
Weise kann die Lese- und Schreibfähigkeit ein ausreichendes Niveau erreichen.
Ist hingegen der direkte Weg über das semantische Gedächtnis auf irgendeine
Weise beeinträchtigt, so müssen alle Wörter über die GPK-Regeln
erlesen oder geschrieben werden (Klicpera & Gasteiger-Klicpera, 1995, S.
196 f.). Als Folge kommt es zur Oberflächendyslexie, die sich in Schwierigkeiten
bei unregelmäßigen Wörtern und Homophonen äußert.
Außerdem werden dabei zahlreiche Neologismen produziert. Beide Arten von
Lese-Rechtschreibschwierigkeiten wurden auch bei leseschwachen Kindern beobachtet,
auch wenn bislang die Frage nach der Unterteilung der Lese-Rechtschreibstörung
in Subgruppen noch nicht hinreichend geklärt ist (siehe z.B. Morris et
al., 1998; Stanovich, Siegel, Gottardo, Chiappe, & Sidhu, 1997; Fletcher
et al. 1997).
Seit etwa 10 Jahren liegt analog zum Aktivations-Modell (Seidenberg & McClelland,
1989) ein Computer-Modell mit der Bezeichnung "dual-route cascaded (DRC)
model of word recognition" vor, das auf der Dual-Route-Theory basiert (siehe
Abb. 6). Das DRC stellt die Synthese von Zwei-Wege-Theorie und PDP-Modell her.
Coltheart, Curtis, Atkins und Haller (1993) erstellten ein Regelsystem, das
erfolgreich alle GPK-Regeln der englischen Sprache integriert und das die indirekte
Route simuliert. Als Modul für die direkte Route wählten sie das PDP-Modell
(Seidenberg & McClelland, 1989). Das DRC vereinigt somit sowohl hierarchische
Komponentenmodelle mit seriellem Ablauf, als auch Netzwerkmodelle mit paralleler
Arbeitsweise. Die einzelnen Komponenten des DRC arbeiten bidirektional und das
System durchläuft so viele Zyklen, bis ein stabiles Optimum gefunden ist
(Coltheart & Rastle, 1994).
![]() Abbildung 6 Das dual-route cascaded model (DRC) nach Ziegler, Perry & Coltheart (2000). Die Worterkennung kann entweder direkt unter Einbeziehung des semantischen Systems erfolgen, oder indirekt über das buchstabenweise Erlesen der einzelnen Grapheme. Pfeile symbolisieren exzitatorische und runde Endungen inhibitorische Verknüpfungen. Die Einbeziehung des semantischen Systems - also der Wortbedeutungen wurde bislang wie im PDP-Modell (Seidenberg & McClelland, 1989) nicht realisiert. |
Mit dem DRC gelang es, lautes Lesen am Computer erfolgreich zu simulieren (Coltheart,
Curtis, Atkins & Haller, 1993; Coltheart & Rastle, 1994). Das Modell
wurde darüber hinaus in jüngerer Zeit auf die deutsche Sprache übertragen
(Ziegler, Perry & Coltheart, 2000) und erwies auch hier seine erstaunliche
Leistungsfähigkeit: Es übertraf bei weitem die Trefferquote des PDP-Modells
und schnitt bei einsilbigen deutschen Wörtern sowie regulär (gemäß
den GPK-Regeln) geschriebenen Lehnwörtern sogar noch etwas besser ab als
deutschsprachige Versuchspersonen. Im Bereich irregulär geschriebener Fremdwörter
lag die Fehlerrate des DRC bei 24,2 % im Vergleich zu 19,5 % bei den Versuchspersonen.
Diese Leistung ist umso beachtlicher wenn man bedenkt, dass das Modell lediglich
die phonetische Realisation von ca. 1 500 einsilbigen deutschen Wörtern
erlernt hatte.
Das DRC überwindet die Schwächen des PDP-Modells, welches darauf
angewiesen ist, dass das zu lesende Wort - oder zumindest eine hinreichend große
Anzahl ähnlicher Wörter - bereits gelernt wurde und im Netzwerk repräsentiert
ist. Gleichzeitig erbt es dessen mentales Lexikon der Wortbedeutungen.
Einschränkend muss festgestellt werden, dass beide Modelle bislang nur
für den Bereich des lauten Lesens Gültigkeit beanspruchen. Auch bleiben
zum jetzigen Zeitpunkt Wörter mit mehr als einer Silbe unberücksichtigt.
Aus diesem Grund ist es beiden Modellen bislang nicht möglich, Wörter
in ihre Silben zu zerlegen und gemäß ihrer Morpheme zu analysieren.
Trotz dieser Einschränkungen kann insbesondere das DRC erstaunliche Erfolge
im Bereich des lauten Lesens und in der Anwendung des Modells auf gestörten
Schriftspracherwerb vorweisen (siehe Coltheart, Curtis Atkins & Haller,
1993; Ziegler, Perry & Coltheart, 2000; Coltheart & Rastle, 1994).