[Home page] [Übersicht] [Overview] [Letzte Änderungen]

Teilprojekt 5:
Lexikon und Morphologie

Forschungs- und Entwicklungsarbeit zum Lexikon muß generelle Fragen des Aufbaus und der Strukturierung von Lexika für maschinelle Übersetzung, Probleme der lexikalischen Disambiguierung, der Beschreibung von Kollokationen und anderen redetypischen Wortkombinationen und Fragen der Organisation von kontrastiv-lexikalischem Übersetzungswissen berücksichtigen. Zusätzlich ergeben sich spezielle Anforderungen eines maschinellen Übersetzungssystems für gesprochene Sprache. Diese betreffen die lexikalischen Wissensquellen, die zu beschreibenden linguistischen Objekte, die Typen lexikalischer Information sowie den Aufbau, die Strukturierung und die Repräsentation der Lexika.

Im Rahmen constraint-basierter Ansätze zur maschinellen Sprachverarbeitung im allgemeinen und für die Verarbeitung gesprochener Sprache im besonderen, werden inkrementelle Verfahren bevorzugt, die die linguistischen Beschreibungen einzelner Ebenen enthalten und die potentielle Bereitstellung aller Informationen gleichzeitig ermöglichen. Dies hat unmittelbare Auswirkungen auf die Strukturierung und die Organisation des lexikalischen Wissens: Informationen der einzelnen linguistischen Beschreibungsebenen müssen parallel verfügbar sein. Das bedeutet, daß modulare Wissensquellen notwendig sind.

Wenn die semantische Repräsentation eines Satzes der Quellsprache zu viel oder zu wenig Information enthält, um einen Satz der Zielsprache zu generieren (translation mismatch), werden komplexe Prozesse angestoßen (negotiator). Das Lexikon ist so zu strukturieren, daß diese Prozesse optimal unterstützt werden.

Die einzelnen Lexikonmodule müssen ein repräsentatives Fragment hinreichend differenziert beschreiben. Um zu vermeiden, daß bei der Entwicklung exemplarische, aber nicht generalisierbare Lösungen gewählt werden, muß schon in einer relative frühen Projektphase ein repräsentatives und detailliertes Lexikonfragment verfügbar sein. Die folgenden Arbeitspakete sollten im Bereich Lexikon und Morphologie behandelt werden:

  1. Korpusanalyse (Experimentierphase und Ausbauphase)
  2. Auswertung existierender Speech-Lexika, MUe-Lexika
  3. Morphologie
  4. Lexikalischer Repräsentationsformalismus
  5. Anpassung und / oder Entwicklung von Werkzeugen für den Lexikonaufbau
  6. Modellierung Lexikonstruktur
  7. Lexikonzugriff
  8. Lexikondatenbank
  9. Aufbau der Verbmobil-Lexika

Nähere Informationen:


[vorhergehendes Teilprojekt] [nächstes Teilprojekt] [Veröffentlichungen]


© Webmaster