Technologie
Neben der Entwicklung von computerbasierten standardisierten Testverfahren, Auswertungssoftware und Lernumgebungen bietet Psychometrica Hochtechnologien aus dem Bereich Mustererkennung und automatische Sprachverarbeitung:1. Latente Semantische Analyse
Die Latente Semantische Analyse (LSA) ist ein statistisches Verfahren aus dem Gebiet der automatischen Sprachverarbeitung zur Analyse von Texten und zur Extraktion von Wort- und Textbedeutungen. Mithilfe der LSA wird die Bedeutung von Wörtern oder der Inhalt von Texten in einer mathematischen Form als Vektor in einem n-dimensionalen Raum repräsentiert. Hierdurch ist es möglich, die inhaltliche Ähnlichkeit von Texten automatisch am Computer zu berechnen und somit Texte zu bewerten und zu kategorisieren.Die LSA kommt völlig ohne die Spezifikation von Regeln aus, sondern sie "lernt" aus vorgegebenem Textmaterial und extrahiert die Wort- und Textbedeutung automatisch. Wurde das System mit einer ausreichenden Menge an Texten trainiert, dann ist es in der Lage, neues, unbekanntes Material zu bewerten.
Dabei lassen sich mit der LSA Leistungen erzielen, die menschlicher sprachlicher Intelligenz stark ähneln. Beispielsweise war es möglich, nach einem Training mit etwa 30 000 Textabschnitten zu den Themengebieten Biologie und Erdkunde einen Wissenstest zur Kategorisierung von Tierarten erfolgreich zu bestehen. Das LSA-System ordnete bis zu 97,6% der Tierarten der korrekten Tiergattung zu und erzielte damit eine Leistung, die auf dem Niveau von Studenten der Biologie (Diplom) lag. Auch konnten Diplom-Psychologie-Klausuren vom System ebenso zuverlässig benotet werden, wie von menschlichen Experten (siehe Lenhard et al., 2007a). LSA lässt sich einsetzen, um intelligente Tutorsysteme zu konstruieren, die beispielsweise Schülern beim Schreiben von Aufsätzen assistieren (siehe Lenhard et al., 2007b). Dabei ist ein LSA-basiertes System ungleich viel schneller als ein Mensch: Je nach Umfang der Texte bewertet unsere Software etwa 10 000 Texte pro Sekunde.
Konkrete LSA-basierte Anwendungen und Dienstleistungen *:
a.) LSA-Engine
Die LSA-Engine ist eine Entwicklungsumgebung zur Verwaltung von Textsammlungen, Berechnung von semantischen Räumen und Durchführung von Ähnlichkeitsvergleichen. Die LSA-Engine ist sowohl über ein Webinterface, als auch über eine Programmierschnittstelle bedienbar. Sie kann mit Texten in beliebigen Sprachen umgehen und ist durch eine Plugin-Struktur flexibel erweiterbar.
b.) ASSIST
ASISST ist eine webbasierte E-Learning-Plattform zur Betreuung universitärer Veranstaltungen, die neben den gängigen Verwaltungswerkzeugen LSA integriert. Zum einen lässt sich hierdurch schnell und einfach inhaltliches Plagiat aufspüren. Zum anderen können offene Antworten automatisch bewertet werden. Das System ist dabei zugleich in der Lage, die Verlässlichkeit der automatischen Bewertung rückzumelden und ggf. den Benutzer über eine nicht hinreichend reliable computerbasierte Punktevergabe zu informieren. ASSIST ist in der Lage, die Dozierenden bei der Korrektur von Klausuren und Übungsaufgaben deutlich zu entlasten.
In der konkreten Anwendung in Hochschulveranstaltungen bewährte sich das System bereits bei tausenden von Studenten. Das System erzielte Übereinstimmungen mit menschlichen Experten, die in der gleichen Höhe liegen wie menschliche Interraterkorrelationen bei der Bewertung offener Antworten.
c.) Berechnung semantischer Räume
Mithilfe unserer optimierten Algorithmen können wir auch sehr große Textsammlungen verarbeiten und Ihnen semantische Räume berechnen, die sie in eigene Anwendungen einbetten. Bitte kontaktieren Sie uns für ein unverbindliches Angebot.
* In Zusammenarbeit mit dem Institut für Psychologie, Universität Würzburg.
2. Support Vector Machines
Eine Support Vector Machine (SVM) dient der Klassifikation von Objekten in zwei oder mehr Kategorien. Sie basiert auf einem mathematischen Verfahren zur Mustererkennung. Eine SVM lernt aus einer Menge an bereits klassifizierten Trainingsobjekten. Diese Trainingsobjekte werden anhand ihrer Eigenschaften in einem n-dimensionalen Raum angeordnet. Die SVM bildet die Klassen so, dass zwischen den Klassen ein möglichst großer, freier Raum bestehen bleibt. Hierfür wird in den Vektorraum mehrdimensionale Hyperebenen eingezogen, deren Verlauf durch die Vektoren der nächstliegenden Objekte spezifiert wird (deswegen "support vectors"). Die auf diese Weise gebildeten Grenzen zwischen den verschiedenen Klassen sollen es dann ermöglichen, auch die Klassenzugehörigkeit von Objekten zu erschließen, die nicht im Satz an Trainingsobjekten vorhanden waren.SVM können dazu eingesetzt werden, die prognostische Validität von Testverfahren zu verbessern, deren Ziel beispielsweise die Klassifikation von Personen in Risiko- und Nicht-Risiko-Gruppen ist.
3. Neuronale Modellierung
Die Modellierung mit künstlichen neuronalen Netzen stellte ursprünglich den Versuch dar, Lernprozesse im menschlichen Gehirn mit Hilfe von mathematischen Algorithmen nachzubilden. Wie echte (d.h. biologische) neuronale Netze verfügen sie deshalb über einzelne Elemente (Neuronen), die Information aufnehmen und nach bestimmten Regeln an andere Neuronen weiterleiten. Verbindungen zwischen zwei Neuronen können sich während eines Lernprozesses verstärken oder abschwächen.Obwohl heutzutage in der Regel eher die Unterschiede als die Gemeinsamkeiten zwischen künstlichen und echten neuronalen Netzen betont werden, stellen künstliche neuronale Netze ein mächtiges Instrument zur Mustererkennung und Klassifikation dar. Die Vorteile liegen dabei ähnlich wie bei den anderen beschriebenen Verfahren darin, dass künstliche neuronale Netze keine expliziten Regeln darüber benötigen, wie ein bestimmtes Muster aus vorhandenen Eingangsdaten entsteht. Vielmehr genügt ein repräsentatives Set an Eingangs- und Ausgangsdaten. Somit können auch komplexe Muster und Klassifikationen durch neuronale Netze gelernt und abgebildet werden. Die neuronale Modellierung wird deshalb vor allem bei der Bild-, Sprach- und Schrifterkennung eingesetzt.