[Home page] [Übersicht] [Overview] [Letzte Änderungen]

Teilprojekt 7:
Formalismus und Verarbeitung

Die maschinelle Übersetzung gesprochener Sprache setzt voraus, dass Information aus allen Beschreibungsebenen (d.h. von der Phonetik bis zur Wissensrepraesentation) gleichzeitig zur Verfügung steht. Die Interaktion all dieser Ebenen muss in modularer und effizienter Weise organisiert sein. Der in Verbmobil zu entwickelnde Basisformalismus muß erlauben, linguistische Fakten aus all diesen Bereichen in eleganter und durchsichtiger Weise auszudrücken und muss leicht zu verstehen und zu erlernen sein und sollte sich an den gängigen Theorien orientieren, um die Übernahme von Beschreibungen aus der linguistischen Forschung zu ermöglichen. Er muss die modulare Entwicklung und anschliessende Wartung eines grossen Systems mit komplexen Interaktionen durch eine größere Zahl von Personen mit unterschiedlichem linguistischen und formalen Hintergrund unterstützen.

Ein Aspekt, der bei der Frage der Durchschaubarkeit des Formalismus eine wesentliche Rolle spielt, ist die Unabhängigkeit der Beschreibung des linguistischen Wissens von Details der algorithmischen Verarbeitung. Diese Anforderung läßt sich mittels der gängigen Begriffe Deklarativitaet, Monotonie und Reversibilität charakterisieren. Diese Eigenschaften stellen einerseits sicher, dass die Beschreibungen leichter zu warten und zu testen sind (wobei selbst automatische Methoden der Konsistenzprüfung eine wichtige Rolle spielen), andererseits wird dadurch eine flexible Anwendung derselben Wissensquelle bei verschiedenen Aufgabestellungen (z.B. Analyse versus Synthese) ermöglicht. Dem einheitlichen Formalismus entspricht ein einheitliches, von der Anwendung unabhängiges Verarbeitungsmodell, bei dem eine gegebene partielle Beschreibung einer linguistischer Entität anhand aller relevanten linguistischen Wissensquellen durch Ergänzen fehlender Information inkrementell verfeinert wird. Sowohl Analyse als auch Generierung basieren hierbei auf demselben grundlegenden Mechanismus. Der Unterschied besteht nur darin, welche Teile der Ausgangsstruktur bekannt sind und welche Teile durch die Verarbeitung ergänzt werden. Allerdings führen die beim heutigen Stand der Technik einsetzbaren Verarbeitungsstrategien für Formalismen mit hinreichender Ausdrucksstärke nicht automatisch zu Implementierungen, deren Effizienz für eine Anwendung in Echtzeit ausreicht. Dies wird sich jedoch in dem Masse verbessern, in dem zur Zeit in Entwicklung befindliche Implementierungstechniken zum Einsatz kommen. Es sind daher geeignete Verarbeitungs- und Kontrollstrategien zu entwickeln, die eine effiziente Verarbeitung des Basiformalismus erlauben. Dies schliesst neben Mechanismen zu faktorisierten Darstellung von Alternativen auch die Kombination mit stochastischen Methoden ein.

Die syntaktische Komponente in einem System zur Verarbeitung spontaner gesprochener Sprache muss mit einer Vielzahl ungrammatischer Eingaben zurechtkommen. Die Verarbeitungskomponente ist daher um geeignete Korrektur- bzw. graceful degradation-Methoden anzureichern, um eine robuste Verarbeitung der Eingaben zu erreichen.

Nähere Informationen:


[vorhergehendes Teilprojekt] [nächstes Teilprojekt] [Veröffentlichungen]


© Webmaster