[Home page] [Übersicht] [Overview] [Letzte Änderungen]

Teilprojekt 1:
Interaktion von Akustik und Linguistik

Gegenstand des Teilprojekts ist die Integration aller Wissensquellen in den Erkennungsprozeß, um eine möglichst sichere Erkennung von Sprachäußerungen zu erreichen. Während in dem Teilprojekt "Spracherkennung und Sprecheradaption" die akustisch-phonetische Wissensquellen (Wort- und Lautmodelle) behandelt wird, werden in diesem Teilprojekt die linguistischen Wissensquellen (Language Modelle) und die Integration (Suche) der akustisch-phonetischen mit den linguistischen Wissensquellen zur Bestimmung der erkannten Wortfolge einer Äußerung behandelt. Der bisher erfolgreichste Methode zur Modellierung und Integrierung der Wissensquellen in den Suchprozeß leitet sich aus dem Maximum-Likelihood-Ansatz ab:

Max(über alle W) [P(O|W)*P(W)]
O=Folge der Merkmalsvektoren, W=Wortfolge,P=Wahrscheinlichkeit

wobei diejenige Wortfolge W gesucht wird, bei der obiges Produkt maximiert wird. Der Ausdruck P(O|W) modelliert das akustisch-phonetische der Ausdruck P(W) das linguistische Wissen.
Der Algorithmus zur Bestimmung der optimalen Wortfolge ist Gegenstand der Suche. Die Modellierung der Wissensquellen ist eng mit dem Suchproblem verknüpft, da nur Modellierungen in Frage kommen, die eine effiziente Implementierung der Suche erlauben. Dies stellt insbesonders ein Problem in der Modellierung linguistischer Wissensquellen dar. Deshalb wurden bisher nur sehr ein-fache Language Modelle (Bigramme, Trigramme) eingesetzt,die jedoch nur lokale Wortbindungen beschreiben und sich nur ungenügend an den Situationskontext anpassen können. Ferner erlauben sie nicht die Behandlung unbekannter bzw. neuer Wörter.
Der Suchalgorithmus selbst bildet den algorithmischen Kern des Erkennungssystems . An ihn werden hohe Anforderungen gestellt. Er soll
- mit hoher Wahrscheinlichkeit die optimale Wortfolge auffinden,
- schritthaltend Analyseergebnisse liefern,
- effizient arbeiten,
- eine geeignete Schnittstelle zur weiteren linguistischen Verarbeitung darstellen.

Nähere Informationen:


[nächstes Teilprojekt] [Veröffentlichungen]


© Webmaster