Lesen ohne zu Lesen

News: Lesen ohne zu Lesen

Ein Projekt der Universität Trier setzt es sich zum Ziel, älteren Mitbürgern und Lesebehinderten den Zugang zu elektronischen Dokumenten zu verschaffen. Es will ihnen die Möglichkeit eröffnen, maschinenlesbare Informationen zu nutzen, die nach bestimmten Standards (zum Beispiel mit der Standard Generalized Markup Language, SGML) kodiert werden. Bisher war dies an teure Spezialhardware gebunden sowie an die Fähigkeit, mit einer Tastatur umgehen zu können.

Es gibt viele Informationen, die als elektronisches Dokument vorliegen. Im Sinne einer Standardisierung werden solche Informationen künftig noch vermehrt gemäß der ISO-Norm 8879 (SGML) kodiert. Heute werden in SGML bereits komplexe Druckwerke (Fachbücher, Lexika, Tageszeitungen) und die im Internet verwendeten Texte bereitgestellt. SGML als Codierungsform stellt eine Computersprache dar, in der verschiedenste Formen elektronischer Dokumente repräsentiert werden können. Im Internet ist SGLM in Form von HTML vertreten.

Solange es Computer geben wird, werden solcherart codierte Dokumente lesbar sein müssen. Es ist anzunehmen, daß sich dieser Standard wohl auf weitere Informationsbereiche ausdehnen wird, bis hin zu Texten des alltäglichen Gebrauchs, wie etwa Bedienungsanleitungen. Derzeit ist eine ungemein rasche Entwicklung des Einsatzes dieses Standards für systemneutrale Textanwendungen zu verzeichnen.

Um solchermaßen codierte Informationen zu nutzen, können verschiedene Zugriffsmethoden eingesetzt werden. Diese vernachlässigen jedoch meist die Bedürfnisse älterer – oder zum Beispiel sehbehinderter – Personen. Meist orientieren sich die Systeme überwiegend am Bildschirm beziehungsweise an der Tastatur. Gerade diese Gruppen sind deshalb häufig von den modernen Informationsmöglichkeiten weitgehend ausgeschlossen. Ziel eines Projektes der Zentralstelle für Psychologische Information und Dokumentation der Universität Trier ist eine deutliche Verbesserung der Informationsmöglichkeiten, wobei möglicherweise gleichzeitig eine Steigerung der Lebensqualität zu verzeichnen sein wird.

Bislang verfügbare Systeme gehen nach Meinung der Trierer Wissenschaftler nur in sehr begrenztem Umfang auf die kognitiven Gegebenheiten einer akustischen Erschließung ein, wobei keine Texte verarbeitet werden können, die gemäß SGML strukturiert wurden. Sie orientieren sich außerdem nahezu allesamt nur am Bildschirmaufbau, also an visuellen Vorgaben. Doch inzwischen können Computer durchaus auf Sprache reagieren und Sprache synthetisieren. Für die Wissenschaftler heißt das, sich einfach mit dem Rechner informieren funktioniert am besten, wenn Hören und Sprechen als Standard für die Codierung von Dokumenten genutzt wird.

Es handelt sich bei dem Projekt um die Entwicklung, Anpassung und Integration von Programm-Modulen, die eine Erschließung von strukturierten Texten unter Nutzung der Sprachein- und -ausgabe ermöglichen. Zentral ist dabei der Einsatz von Software zur Spracherkennung (sprecherunabhängige Erkennung mit einer einfachen kontextfreien Grammatik per Wordspotting (Einzelwort-Erkennung), Programm von Learnout & Hauspie, Belgien) Sprachsynthese (Software-generierte Sprache für Soundblaster-Standard, ebenfalls von Learnout & Hauspie) sowie der Einsatz eines Parsers basierend auf PERL für die zu erschließenden Texte.

Strukturierte Texte (z. B. Datenbankinformationen, technische Beschreibungen, Anleitungen) können mit dem inzwischen entwickelten Prototypen vollständig per Sprechen und Hören erschlossen werden. Es handelt sich um ein aktives Dialogsystem, das mit sprecherunabhängiger Spracheingabe und weitgehend freier Satzwahl strukturierte Zielinformationen aus umfänglichen Texten per synthetischer Sprache mehrsprachig ausgegeben werden kann. Neben Unterbrechungsmöglichkeiten ("barge in") wurden weitere Mechanismen implementiert, die akustisch einem "Querlesen" entsprechen. Das System basiert erstmals auf internationalen (SGML) und proprietären (SAPI) Standards.

Das Projekt wird auf der CeBIT 1999 in Halle 16, Stand B43 vorgestellt.

Der Heidelberger Verlag Spektrum der Wissenschaft ist Betreiber dieses Portals. Seine Online- und Print-Magazine, darunter »Spektrum der Wissenschaft«, »Gehirn&Geist« und »Spektrum – Die Woche«, berichten über aktuelle Erkenntnisse aus der Forschung.