Lexikon der Neurowissenschaft: maschinelles Sprachverstehen
maschinelles Sprachverstehens, Eautomatic speech understanding, technischer Prozeß, der die Kommunikation zwischen Mensch und Maschine erleichtern soll. Im Unterschied zu einem sprachgesteuerten Diktiersystem, welches die Benutzeräußerung lediglich in Form einer Wortsequenz wiedergibt, soll ein System zum maschinellen Sprachverständnis den Sinn der formulierten Eingabe erfassen und dem Benutzer über die Sprache einen Zugang zu Informationsquellen ermöglichen. Das Ziel des maschinellen Sprachverstehens liegt somit in der Entwicklung intelligenter Schnittstellen für eine computergestützte Mensch-Maschine-Interaktion. Zum maschinellen Sprachverstehen sind Techniken der Spracherkennung, der semantischen Analyse natürlich gesprochener Sprache, der Dialogführung sowie der Sprachsynthese erforderlich. Als wissenschaftliche Disziplinen kommen dabei die Signalverarbeitung, die Informatik, die künstliche Intelligenz, die kognitiven Wissenschaften sowie die Linguistik zum Tragen. – Als parsing bezeichnet man die Extraktion der Bedeutung eines Satzes, bzw., im Falle des maschinellen Sprachverstehens, einer Benutzeranfrage. Dies geschieht unter Verwendung syntaktischer oder semantischer Regeln (Syntax, Semantik). Die Konzeption eines Parsers zur Analyse natürlich gesprochener Sprache stellt den Systementwickler vor die Aufgabe, einen an die spezifische Anwendung optimal angepaßten grammatikalischen Formalismus sowie die Implementierungsart auszuwählen. – Die Modellierung des Verstehens natürlich gesprochener Sprache beruht häufig auf kognitiven Prozessen, die sich wiederum auf Theorien der Linguistik und Psychologie stützen. Auf der Grundlage einer syntaktischen Satzanalyse liefern kognitive Modelle eine abstrakte Beschreibung der Sprache. Diese Grammatiken eignen sich deshalb besonders gut für die Analyse von Schriftsprache, die von Natur aus syntaktisch meist korrekt ist. Unter realen Benutzerbedingungen treten in der Interaktion mit einem System zum maschinellen Sprachverständnis jedoch eine erhebliche Anzahl spontaner Formulierungen und Phänomene auf, wie z.B. Zögern, Wortwiederholungen und Verbesserungen. Diese können nur sehr begrenzt mit den traditionellen linguistischen Theorien bearbeitet werden. Leistungsfähige Sprachverarbeitungssysteme, die einem breiten Nutzerkreis zugänglich gemacht werden sollen, müssen derartige Phänomene jedoch unbedingt beherrschen. Dabei sollte die Sprache lediglich als Hilfsmittel der Konversation betrachtet werden. Der semantischen Analyse geht es hierbei in erster Linie darum, den Sinn der Benutzeräußerung zu extrahieren, und nicht um die Feststellung syntaktischer Korrektheit. Immer häufiger kommt es zur Anwendung grammatikalischer Formalismen, die einen Satz semantisch interpretieren können, ohne dabei seine vollständige syntaktische Korrektheit zu fordern. Die Semantik, in diesem Zusammenhang eine Art maschineninterne Darstellung, ruft einen Prozeß oder eine Systemreaktion im Rahmen einer spezifischen Anwendung hervor. Derartige sogenannte semantische Grammatiken können eine Vielfalt möglicher Benutzeräußerungen bearbeiten und sind deshalb gegenüber spontaner Sprache robuster. – Ein weiterer wichtiger Aspekt in der Konzeption eines Systems zum maschinellen Sprachverstehen liegt in einer geeigneten Implementierung des grammatikalischen Formalismus. Wird eine Grammatik in der Form von handgeschriebenen Regeln realisiert, so stellt sich das Problem zunehmender Systemkomplexität und Portierbarkeit. Das im Laufe der Entwicklung immer aufwendiger werdende Regelwerk kann zu Wartungs- und Konsistenzproblemen führen. Außerdem sind die Regeln angepaßt, um optimale Leistungen im Rahmen einer spezifischen Anwendung zu erbringen. Diese Umstände machen ein regelbasiertes System schwerfällig und verringern die Möglichkeiten einer schnellen Anpassung an neue Anwendungen und menschliche Sprachen. – Statistische Methoden, die auf der Anwendung von Hidden-Markov-Modellen beruhen, liefern gute Ergebnisse im Bereich der Spracherkennung und jüngst auch im Rahmen der semantischen Analyse. In diesem Ansatz wird das explizite Regelwerk durch einen Datencorpus, bestehend aus Benutzeranfragen mit zugehöriger semantischer Darstellung, ersetzt. Nach der automatischen Datenanalyse durch das System wird die semantische Information in der Form von Parametern in einem stochastischen Modell gespeichert (Trainingsphase). Dieses Modell wird dann verwendet, um eine unbekannte Benutzeräußerung in eine semantische Darstellung umzusetzen (Testphase). Da die semantische Information in einem anwendungsbedingten Datencorpus codiert ist, ist solch ein statistischer Ansatz im Vergleich zu regelbasierten Systemen wesentlich flexibler und somit leicht wiederverwendbar.
W.M.
Lit.:Bresnan, J. (Hrsg.): The Mental Representation of Grammatical Relations. Cambridge, Massachusetts 1982. Burton, R.: Semantic Grammar: An Engineering Technique for Constructing Natural Language Understanding Systems. BBN Technical Report No. 3353 (1976), Cambridge, Massachusetts. Chomsky, N.: Aspects of the Theory of Syntax. Cambridge, Massachusetts 1965. Fillmore, Ch.J.: The case for case. in: Universals in Linguistic Theory (1968), pp. 1-90. Minker, W., Waibel, A. und Mariani, J.: Stochastically-based Semantic Analysis. The Kluwer International Series in Engineering and Computer Science Vol. 514 (1999). Pieraccini, R. und Levin, E.: Stochastic Representation of Semantic Structure for Speech Understanding. Speech Communication 11 (1992), pp. 283-288. Rabiner, L.R. und Juang, B.H.: An introduction to Hidden Markov Models. IEEE Transactions on Acoustics, Speech and Signal Processing 3(1) (1986), pp. 4-16.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.