[Home page] [Übersicht] [Overview] [Letzte Änderungen]

Teilprojekt 5:
Sprachgenerierung und -synthese

In der zweiten Phase von Verbmobil soll für die Sprachgenerierung und -synthese unter dem Aspekt der Multilingualität die Erzeugung von Äußerungen in mehreren Zielsprachen im Vordergrund stehen, unter dem Aspekt der Benutzerakzeptanz die Verbesserung der Aussprachequalität durch Realisierung eines "Concept-to-Speech" Ansatzes. In der Sprachgenerierung soll im Rahmen der Überprüfbarkeit der Verstehensleistung von Verbmobil eine Paraphrasierung in der Muttersprache des Benutzers von Verbmobil realisiert werden und schließlich den Dialogpartnern eine schriftliche Fixierung des Gesprächs in den verschiedenen Sprachen in Form eines Dialogprotokolls zur Verfügung gestellt werden können. Bei der Bearbeitung dieser Aufgabenstellungen kann auf den guten Ergebnissen der bisherigen Teilprojekte zur spontansprachlichen Generierung und zur Synthese aufgebaut werden.

Im Hinblick auf Multilingualität muß untersucht werden, bis zu welchem Grad Verarbeitungsverfahren und Wissensquellen entwickelt werden können, die weitgehend sprachenunabhängig einsetzbar sind. Am Ende der zweiten Phase soll ein sprachenunabhängiges System stehen, das ohne großen Aufwand um weitere Sprachen erweiterbar ist. Für die Generierungskomponente müssen sowohl sprachspezifische Mikroplanungsregeln erstellt als auch als wesentliches Forschungsziel sprachenunabhängige Verarbeitungsmechanismen entwickelt werden, die auf entsprechend adaptierten sprachspezifischen Grammatiken und Lexika (Teilprojekt 2) operieren. Diese Verarbeitungsmechanismen sollen im Umfeld möglichst ambiguitätserhaltender Übersetzung (in Absprache mit TP 3) auf unterspezifizierten Strukturen operieren können. Für die Synthesekomponente müssen sprachspezifische Inventare für die Zielsprachen Deutsch und Englisch erstellt bzw. erweitert werden. Hierfür ist phonetische Forschung erforderlich, um den generischen Ansatz für die synthetisierten Zielsprachen nach koartikulatorischen Gesichtspunkten zu optimieren. Sprachspezifisch ist insbesondere auch die akustische Prosodie. Um eine qualitativ hochwertige Umsetzung der linguistischen Konzepte zu ermöglichen, müssen geeignete Verfahren (neuronales Netz, Regelsysteme) entwickelt bzw. erweitert werden. Die hierfür notwendigen Daten werden in Zusammenarbeit mit Teilprojekt 6 erhoben. Sprachübergreifend ist die Verbesserung des in der ersten Phase erreichten Standes der Inventarrepräsentation und der Verkettungsstrategien erforderlich, sowohl hinsichtlich größerer Flexibilität z.B. durch halbparametrische Repräsentation als auch hinsichtlich größerer Ökonomie z.B. durch Reduktion der Speicherplatzanforderungen.

Wesentliches Ziel von Teilprojekt 5 ist eine entscheidende Verbesserung der Qualität der Sprachausgabe durch die Realisierung einer engen Verzahnung der Sprachgenerierung und -synthese in einem "Concept-to-Speech" Ansatz. Hier ist eine ausgedehnte linguistisch-phonetische Untersuchung erforderlich, deren Ergebnis als Basis für die Formulierung der Konzepte dienen soll, mit denen sämtliche in den Einzelsprachen auftretenden Phänomene abgedeckt werden müssen. Für die Realisierung von "Concept-to-Speech" muß die Generatorausgabe bereits zielgerichtet für die prosodie-orientierte Syntheseannotierte Information bereitstellen, die eine Reanalyse innerhalb der Synthesekomponente überflüssig macht. Vom Sprecher intendierte Hervorhebungensollen in der integrierten Sprachgenerierungs- und -synthesekomponente alternativ durch syntaktische Mittel (etwa topikalisierte Konstruktionen), durch intonatorische/prosodische Mittel (Satzbetonung, Lautdauern, Pausen) oder deren Kombinationen realisiert werden können. Voraussetzung hierfür ist, daß die entsprechenden Konzepte aus der Analysephase (Teilprojekte 1 und 2) bereitgestellt werden.

Ein wichtiger Parameter für die Sprachgenerierungs- und -synthesekomponente ist der Grad der Inkrementalität bzw. das Ausnutzen der inhaltlichen Reduktion von Äußerungen im Gesamtsystem. Hierbei werden Forschungsergebnisse der Begleitforschung zu Übersetzungsstrategien sowie die Vorarbeiten im Teilprojekt Architektur in Phase 1 als sehr relevant angesehen.

Für die Sprachgenerierung muß eine Schnittstelle zu Teilprojekt 4 - Dialogverarbeitung und Kontextauswertung - entwickelt werden, um die Erzeugung von Paraphrasen ausgehend von einer Bedeutungsrepräsentation anstoßen zu können. Der im Dolmetschprozeß verwendete Generator muß so parametrisierbar sein, daß ein Umschalten auf den Paraphrasenmodus im selben Verarbeitungsmechanismus möglich ist. Darüberhinaus soll auch die Produktion eines geschriebenen Protokolls über die Parametrisierung desselben Generators möglich sein, indem zielgerichtet grammatikalische Konstruktionen der Schriftsprache angesteuert und Aspekte der Textkohärenz beachtet werden.

In Zusammenarbeit mit Teilprojekt 7 - Systemgruppe - kann das Problem angegangen werden, situative Einflußfakßoren zu erkennen und zu berücksichtigen. Dies ist besonders im Hinblick auf das vorgesehene Multipartyszenariovon Bedeutung. Das Generierungssystem kann mit Ansteuerung von Wiederholung oder Selbstkorrektur auf solche Situationen reagieren. Die Sprachsynthese kann beiStörungen durch hyperkorrekte und verlangsamte Sprechweise die Verständlichkeit der synthetisierten Sprache zum Teil deutlich verbessern. Zur Diskriminierung verschiedener Dialogteilnehmer sollen die synthetischen Stimmen den Originalsprechern eindeutig zugeordnet werden können; hierfür ist die Adaption der Synthese an den jeweiligen Benutzer erforderlich.

Weitere Informationen:


[vorhergehendesTeilprojekt] [nächstes Teilprojekt] [Veröffentlichungen]


© Webmaster