News: Lesen ohne zu Lesen
Solange es Computer geben wird, werden solcherart codierte Dokumente lesbar sein müssen. Es ist anzunehmen, daß sich dieser Standard wohl auf weitere Informationsbereiche ausdehnen wird, bis hin zu Texten des alltäglichen Gebrauchs, wie etwa Bedienungsanleitungen. Derzeit ist eine ungemein rasche Entwicklung des Einsatzes dieses Standards für systemneutrale Textanwendungen zu verzeichnen.
Um solchermaßen codierte Informationen zu nutzen, können verschiedene Zugriffsmethoden eingesetzt werden. Diese vernachlässigen jedoch meist die Bedürfnisse älterer – oder zum Beispiel sehbehinderter – Personen. Meist orientieren sich die Systeme überwiegend am Bildschirm beziehungsweise an der Tastatur. Gerade diese Gruppen sind deshalb häufig von den modernen Informationsmöglichkeiten weitgehend ausgeschlossen. Ziel eines Projektes der Zentralstelle für Psychologische Information und Dokumentation der Universität Trier ist eine deutliche Verbesserung der Informationsmöglichkeiten, wobei möglicherweise gleichzeitig eine Steigerung der Lebensqualität zu verzeichnen sein wird.
Bislang verfügbare Systeme gehen nach Meinung der Trierer Wissenschaftler nur in sehr begrenztem Umfang auf die kognitiven Gegebenheiten einer akustischen Erschließung ein, wobei keine Texte verarbeitet werden können, die gemäß SGML strukturiert wurden. Sie orientieren sich außerdem nahezu allesamt nur am Bildschirmaufbau, also an visuellen Vorgaben. Doch inzwischen können Computer durchaus auf Sprache reagieren und Sprache synthetisieren. Für die Wissenschaftler heißt das, sich einfach mit dem Rechner informieren funktioniert am besten, wenn Hören und Sprechen als Standard für die Codierung von Dokumenten genutzt wird.
Es handelt sich bei dem Projekt um die Entwicklung, Anpassung und Integration von Programm-Modulen, die eine Erschließung von strukturierten Texten unter Nutzung der Sprachein- und -ausgabe ermöglichen. Zentral ist dabei der Einsatz von Software zur Spracherkennung (sprecherunabhängige Erkennung mit einer einfachen kontextfreien Grammatik per Wordspotting (Einzelwort-Erkennung), Programm von Learnout & Hauspie, Belgien) Sprachsynthese (Software-generierte Sprache für Soundblaster-Standard, ebenfalls von Learnout & Hauspie) sowie der Einsatz eines Parsers basierend auf PERL für die zu erschließenden Texte.
Strukturierte Texte (z. B. Datenbankinformationen, technische Beschreibungen, Anleitungen) können mit dem inzwischen entwickelten Prototypen vollständig per Sprechen und Hören erschlossen werden. Es handelt sich um ein aktives Dialogsystem, das mit sprecherunabhängiger Spracheingabe und weitgehend freier Satzwahl strukturierte Zielinformationen aus umfänglichen Texten per synthetischer Sprache mehrsprachig ausgegeben werden kann. Neben Unterbrechungsmöglichkeiten ("barge in") wurden weitere Mechanismen implementiert, die akustisch einem "Querlesen" entsprechen. Das System basiert erstmals auf internationalen (SGML) und proprietären (SAPI) Standards.
Das Projekt wird auf der CeBIT 1999 in Halle 16, Stand B43 vorgestellt.
Der Heidelberger Verlag Spektrum der Wissenschaft ist Betreiber dieses Portals. Seine Online- und Print-Magazine, darunter »Spektrum der Wissenschaft«, »Gehirn&Geist« und »Spektrum – Die Woche«, berichten über aktuelle Erkenntnisse aus der Forschung.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.