Site menu:

ELFE 1-6

2.1 Modelle der visuellen Worterkennung

Das Erkennen der Bedeutung einzelner Wörter spielt für das Hauptziel des Lesens - dem inhaltlichen Verständnis des schriftlichen Materials - eine zentrale Rolle. Dies wird auch darin deutlich, dass während des Lesevorgangs ein Wort fixiert und anschließend mittels einer Sakkade zum nächsten Wort gesprungen wird. Der Lesevorgang ist also zumindest beim geübten Leser im wesentlichen ein Lesen Wort für Wort (Klicpera & Gasteiger-Klicpera, 1995, S. 13).

Ein faszinierender Effekt, der bereits gegen Ende des 19. Jahrhunderts nachgewiesen wurde, unterstreicht die Bedeutung des Wortes als schriftsprachliche Einheit: Cattel beobachtete, dass Buchstaben innerhalb von Wörtern schneller wahrnehmbar sind als Buchstaben innerhalb von unsinnigen Buchstabenfolgen oder auch Einzelbuchstaben - ein Phänomen, das von ihm als Wortüberlegenheitseffekt bezeichnet wurde (Klicpera & Gasteiger-Klicpera, 1995, S. 14 f.). Gegen Ende der 60er Jahre griff Reicher diesen Effekt wieder auf und untersuchte ihn mittels verbesserter Forschungsinstrumente erneut. Die Erklärung dieses sowie weiterer untergeordneter Effekte ist seitdem eines der Prüfkriterien, die an Modelle der visuellen Worterkennung angelegt werden (Jacobs & Grainger, 1994). Ein weiterer interessanter Effekt auf diesem Gebiet ist der Stroop-Effekt.

Es existieren zahlreiche solcher Modelle, die sich in Format und Komplexität wesentlich unterscheiden. Jacobs und Grainger (1994) berichten von insgesamt 15, die im Zeitraum zwischen 1969 und 1994 entstanden sind. Angesichts dieser Vielfalt möchte ich mich auf einige wesentliche Aspekte beschränken und deshalb stellvertretend drei verschiedene Modelle herausgreifen, die besonderen Einfluss auf die Forschung ausgeübt haben und verschiedene Forschungsansätze repräsentieren. Es handelt sich hierbei um das Logogen-Modell nach Morton (1969), das Aktivationsmodell nach McClelland und Rumelhart (1981) und die Dual-Route-Theory nach Coltheart (1978).


2.1.1 Das Logogen-Modell

Erste Prozessmodelle des Lesens und Schreibens wurden von Morton entwickelt, der bereits 1969 eine erste Arbeit über den Worterkennungsvorgang beim Lesen vorgelegt hat (Klicpera & Gasteiger-Klicpera, 1995, S. 97). Er entwickelte diesen Entwurf weiter und veröffentlichte 1979 sein "Logogen-Modell" (Graf, 1994, S. 46), welches auch Vorstellungen über die beim Schreiben ablaufenden Prozesse umfasst (siehe Abb. 2).


Abbildung 2
Das Logogenmodell von Morton in seiner überarbeiteten Version nach Ellis (1982, zitiert nach Klicpera & Gasteiger-Klicpera, 1995, S. 98). Die Abkürzungen neben den Verbindungspfeilen geben an, von welcher Art die  weitergegebenen Informationen sind (visuell, akustisch, grammatikalisch, semantisch, phonemisch, lexikalisch, als motorisches Muster von Graphemen und kinästhetisch).



Viele der Entwürfe, die seitdem entstanden sind, basieren auf Mortons Modell oder wurden zumindest wesentlich davon beeinflusst (Graf, 1994, S. 46). Da diese Modelle in der Tradition der Informationsverarbeitungstheorie stehen, folgt ihre Grobstruktur typischerweise dem Schema "Input -> Verarbeitung -> Output". Als Input können verschiedene Eingangsinformationen wie z.B. gesprochene Sprache oder Schrift dienen, die auf diverse lexikalische und nicht-lexikalische Arten weiterverarbeitet werden. Der Output besteht aus Sprache (beim Lesen) oder Schrift (beim Schreiben) (Klicpera & Gasteiger-Klicpera, 1995, S. 97 ff.). Logogene sind dabei Spracheinheiten, die den mentalen Repräsentationen von Wortbedeutungen entsprechen. Erreicht eine bestimmte Information - z.B. ein bestimmtes Wort - das kognitive System, so wird das zugehörige Logogen aktiviert. Überschreitet die Aktivierung eine bestimmte Schwelle so kommt es zur Erkennung des Wortes.

Ähnlich wie in der Dual-Route-Theory nach Coltheart (1978) sieht das Modell neben lexikalischen Verarbeitungsmöglichkeiten von Wörtern auch die Umwandlung von Sprache in Schrift über die Phonem-Graphem-Korrespondenzregeln (GPK-Regeln) vor. Allerdings spielt diese Strategie hier nur eine untergeordnete Rolle, so Klicpera und Gasteiger-Klicpera (1995, S. 99 f.).


2.1.2 Das Aktivationsmodell (Interactive-Activation-Model)

Ein Modell, das in der Lage ist, den Wortüberlegenheitseffekt zu erklären, und das verschiedene Schwächen früherer Modelle überwindet, wurde von McClelland und Rumelhart (1981) vorgeschlagen. Sie gehen davon aus, dass sowohl grundlegende grafische Elemente (Punkte und Striche, aus denen sich Buchstaben zusammensetzten), als auch Buchstaben und Wörter im Gedächtnis repräsentiert und in Form eines Netzwerkes organisiert sind. Der Worterkennungsprozess beginnt mit der Aufnahme der grafischen Elemente. Diese Merkmale führen zu charakteristischen Aktivierungsmustern im neuronalen Netz: Jene Buchstaben, die den Merkmalen entsprechen werden mittels exzitatorischer Verknüpfungen aktiviert, die anderen über inhibitorische Verbindungen gehemmt. Analog führen die Aktivierungsmuster auf Buchstabenebene wiederum bei Überschreitung eines bestimmten Schwellenwertes zur Aktivierung des zugehörigen Wortes (siehe Abb. 3).


Abbildung 3
Ablauf der Worterkennung im Aktivationsmodell (McClelland & Rumelhart, 1981)



Der Wortüberlegenheitseffekt lässt sich nach Christmann und Groeben (1999) auf der Basis des Aktivationsmodells folgendermaßen erklären: Die Darbietung eines in ein Wort eingebetteten Buchstabens führt zur Aktivierung auf allen drei Ebenen, die Darbietung von Non-Wörtern oder einzelnen Buchstaben hingegen nur auf der Eigenschafts- und Buchstabenebene. Die stärkere Aktivierung wiederum bedingt eine erleichterte Erkennung.

1989 wurde von Seidenberg und McClelland eine erweiterte Version des Modells vorgelegt, das "parallel-distributed-processing (PDP) connectionist model". Es ist vollständig als Netzwerkmodell realisiert und liegt in Form einer Computersimulation vor (siehe Abb. 4). Das in diesem Modell beschriebene Netzwerk besteht aus 400 orthographischen Eingangsknoten, 200 sog. "versteckten Einheiten" ("hidden units") und 460 Ausgangsknoten, die die phonetische Realisation des geschriebenen Wortes beschreiben. Anders als im Modell von McClelland und Rumelhart (1981) repräsentiert ein Eingangsknoten nicht mehr einen einzelnen Buchstaben, sondern ein Buchstaben-Tripel (Coltheart, Curtis, Atkins & Haller, 1993). Wird ein Wort über das visuelle System aufgenommen, so aktiviert es alle zugehörigen Tripel des Netzwerks, also im Falle des Wortes Vater die Tripel "--V", "-Va", "Vat", "ate", "ter", "er-" und "r--". Da die Eingangsknoten mit den Knoten in der Schicht der versteckten Einheiten verbunden sind, breiten sich die Aktivierungsmuster zunächst zur Schicht der versteckten Einheiten und von dort auf die Schicht der phonologischen Ausgangsknoten aus. Die individuelle Gewichtung der einzelnen Verbindungen repräsentiert hierbei die Lernerfahrung des Systems. Da die Ausgangsschicht rückkoppelt, durchläuft das gesamte System eine größere Anzahl an Zyklen, bis schließlich ein stabiler Zustand erreicht ist. Die phonologische Realisation des geschriebenen Wortes wird in der Ausgangsschicht des Netzes repräsentiert. Seidenberg und McClelland (1989) ließen das System die phonetische Realisation von 2 897 einsilbigen Wörtern der englischen Sprache lernen, woraufhin es auch für 90% der Non-Wörter die korrekte Aussprache ermitteln konnte. Das PDP-Modell sieht zusätzlich die Aktivierung von Wortbedeutungen sowohl mittels der phonologischen als auch der grafischen Realisation eines Wortes vor (siehe Abb. 5). Seidenberg und McClelland (1989) gehen davon aus, dass Wortbedeutungen ähnlich wie phonetische Realisationen von Wörtern in einem Netzwerk organisiert sind und über zwischengeschaltete Schichten von versteckten Einheiten aktiviert werden können. Allerdings konnten diese Teile des Modells bislang nicht empirisch bestätigt werden.

Abbildung 4
Skizze des am Computer modellierten neuronalen Netzes von Seidenberg & McClelland (1989), aus: Coltheart, Curtis, Atkins & Haller (1993).
Abbildung 5
Gesamtkonzept des "parallel-distributed-processing-model" (nach Seidenberg & McClelland, 1989). Bislang wurden nur die blau gefärbten Teile des Modells implementiert.




2.1.3 Die Zwei-Wege-Theorie

Eine der prominentesten Theorien der visuellen Worterkennung ist sicherlich die Zwei-Wege-Theorie oder "Dual-Route-Theory", die erstmals von Coltheart (1978) vorgeschlagenen wurde und seitdem Gegenstand vielfältiger Publikationen war. Sie steht nicht nur in Einklang mit zahlreichen neurologischen Erkenntnissen aus dem Bereich der erworbenen Dyslexie, sondern hat auch die Forschung nach Subgruppen der Lese-Rechtschreibstörung wesentlich befruchtet (siehe z.B. Morris et al., 1998; Stanovich, Siegel, Gottardo, Chiappe, & Sidhu, 1997; Fletcher et al. 1997).

Die Zwei-Wege-Theorie beschreibt zwei mögliche Verarbeitungsmechanismen im Lese-Prozess (Coltheart & Rastle, 1994) - einen direkten, lexikalischen und einen indirekten, non-lexikalischen. Der erste, direkte Weg besteht gemäß dieser Theorie in einer orthographischen Kodierung des Schriftbildes, über den direkt ein Eintrag im mentalen Lexikon aktiviert wird. Die Aussprache des Wortes ist also unmittelbar zugänglich. Bei Wörtern, die nicht im Lexikon vertreten sind, wird hingegen die zweite, indirekte Route gewählt. Da hier keine Eintragung im Lexikon vorliegt, muss das Wort über die Graphem/Phonem-Zuordnung Buchstabe für Buchstabe erlesen werden. Die phonologische Struktur eines Wortes wird also mittels phonologischer Rekodierung von Buchstaben bzw. Buchstabengruppen seriell rekonstruiert.

Neurologen berichten immer wieder von Patienten, bei denen aufgrund einer hirnorganischen Schädigung eine dieser beiden Routen nicht verfügbar ist. Diese Studien zeigen, dass beide Strategien für das Lesen und Schreiben essentiell wichtig zu sein scheinen. Ist nur der direkte Weg möglich, so haben betroffene Menschen immense Schwierigkeiten beim Erlesen von Pseudowörtern (Klicpera & Gasteiger-Klicpera, 1995, S. 193). Da solche Wörter inhaltsfrei sind, können sie nicht im semantischen Gedächtnis präsent sein. In diesem Fall kommt es zu einer phonologischen Dyslexie. Es ist allerdings theoretisch möglich dieses Defizit der Graphem/Phonem- und Phonem/Graphem-Zuordnung durch ein hinreichend umfassendes semantisches Gedächtnis zu kompensieren, da Pseudowörter im Alltag nur eine untergeordnete Rolle spielen. Auf diese Weise kann die Lese- und Schreibfähigkeit ein ausreichendes Niveau erreichen. Ist hingegen der direkte Weg über das semantische Gedächtnis auf irgendeine Weise beeinträchtigt, so müssen alle Wörter über die GPK-Regeln erlesen oder geschrieben werden (Klicpera & Gasteiger-Klicpera, 1995, S. 196 f.). Als Folge kommt es zur Oberflächendyslexie, die sich in Schwierigkeiten bei unregelmäßigen Wörtern und Homophonen äußert. Außerdem werden dabei zahlreiche Neologismen produziert. Beide Arten von Lese-Rechtschreibschwierigkeiten wurden auch bei leseschwachen Kindern beobachtet, auch wenn bislang die Frage nach der Unterteilung der Lese-Rechtschreibstörung in Subgruppen noch nicht hinreichend geklärt ist (siehe z.B. Morris et al., 1998; Stanovich, Siegel, Gottardo, Chiappe, & Sidhu, 1997; Fletcher et al. 1997).

Seit etwa 10 Jahren liegt analog zum Aktivations-Modell (Seidenberg & McClelland, 1989) ein Computer-Modell mit der Bezeichnung "dual-route cascaded (DRC) model of word recognition" vor, das auf der Dual-Route-Theory basiert (siehe Abb. 6). Das DRC stellt die Synthese von Zwei-Wege-Theorie und PDP-Modell her. Coltheart, Curtis, Atkins und Haller (1993) erstellten ein Regelsystem, das erfolgreich alle GPK-Regeln der englischen Sprache integriert und das die indirekte Route simuliert. Als Modul für die direkte Route wählten sie das PDP-Modell (Seidenberg & McClelland, 1989). Das DRC vereinigt somit sowohl hierarchische Komponentenmodelle mit seriellem Ablauf, als auch Netzwerkmodelle mit paralleler Arbeitsweise. Die einzelnen Komponenten des DRC arbeiten bidirektional und das System durchläuft so viele Zyklen, bis ein stabiles Optimum gefunden ist (Coltheart & Rastle, 1994).


Abbildung 6
Das dual-route cascaded model (DRC) nach Ziegler, Perry & Coltheart (2000). Die Worterkennung kann entweder direkt unter Einbeziehung des semantischen Systems erfolgen, oder indirekt über das buchstabenweise Erlesen der einzelnen Grapheme. Pfeile symbolisieren exzitatorische und runde Endungen inhibitorische Verknüpfungen. Die Einbeziehung des semantischen Systems - also der Wortbedeutungen wurde bislang wie im PDP-Modell (Seidenberg & McClelland, 1989) nicht realisiert.



Mit dem DRC gelang es, lautes Lesen am Computer erfolgreich zu simulieren (Coltheart, Curtis, Atkins & Haller, 1993; Coltheart & Rastle, 1994). Das Modell wurde darüber hinaus in jüngerer Zeit auf die deutsche Sprache übertragen (Ziegler, Perry & Coltheart, 2000) und erwies auch hier seine erstaunliche Leistungsfähigkeit: Es übertraf bei weitem die Trefferquote des PDP-Modells und schnitt bei einsilbigen deutschen Wörtern sowie regulär (gemäß den GPK-Regeln) geschriebenen Lehnwörtern sogar noch etwas besser ab als deutschsprachige Versuchspersonen. Im Bereich irregulär geschriebener Fremdwörter lag die Fehlerrate des DRC bei 24,2 % im Vergleich zu 19,5 % bei den Versuchspersonen. Diese Leistung ist umso beachtlicher wenn man bedenkt, dass das Modell lediglich die phonetische Realisation von ca. 1 500 einsilbigen deutschen Wörtern erlernt hatte.


2.1.4 Zusammenfassung

Das DRC überwindet die Schwächen des PDP-Modells, welches darauf angewiesen ist, dass das zu lesende Wort - oder zumindest eine hinreichend große Anzahl ähnlicher Wörter - bereits gelernt wurde und im Netzwerk repräsentiert ist. Gleichzeitig erbt es dessen mentales Lexikon der Wortbedeutungen.

Einschränkend muss festgestellt werden, dass beide Modelle bislang nur für den Bereich des lauten Lesens Gültigkeit beanspruchen. Auch bleiben zum jetzigen Zeitpunkt Wörter mit mehr als einer Silbe unberücksichtigt. Aus diesem Grund ist es beiden Modellen bislang nicht möglich, Wörter in ihre Silben zu zerlegen und gemäß ihrer Morpheme zu analysieren. Trotz dieser Einschränkungen kann insbesondere das DRC erstaunliche Erfolge im Bereich des lauten Lesens und in der Anwendung des Modells auf gestörten Schriftspracherwerb vorweisen (siehe Coltheart, Curtis Atkins & Haller, 1993; Ziegler, Perry & Coltheart, 2000; Coltheart & Rastle, 1994).


>>> Zurück zur Übersicht