[Home page] [Übersicht] [Overview] [Letzte Änderungen]

Teilprojekt 14:
Sammlung, Bearbeitung und Bereitstellung spontansprachlicher Daten

Für die Entwicklung von Spracherkennungssystemen auf der Basis spontansprachlicher Äußerungen, insbesondere auch für Verbmobil, ist die Bereitstellung einer wohlstrukturierten und umfangreichen Sprachsignaldatenbasis von grundlegender Bedeutung. Diese Aufgabe soll durch die im folgenden beschriebenen Arbeitspakete abgedeckt werden, wobei die im bisherigen PHONDAT-Verbund gestellten Aufgaben und Ziele teilweise ihre Relevanz behalten, jedoch bezüglich des Umfangs und im Hinblick auf die spontansprachliche Ausrichtung erheblich erweitert werden. Zur Erstellung einer wohlstrukturierten Sprachsignaldatenbasis sind erforderlich:

Die folgenden Arbeitspakete beschränken sich auf das Deutsche; ein großer Teil der Arbeitspakete läßt sich aber auch auf das darüberhinaus zu erhebende englische und japanische Sprachsignalmaterial anwenden. Bei einem Umfang von etwa 50 000 Satzäußerungen (bzw. ei-nem äquivalenten Umfang in Wörtern) ist das Aufnehmen, Bearbeiten und Aufbereiten auf mehrere Institute zu verteilen. Die Daten sind wie bei PHONDAT zentral zu erfassen und in einheitlichem Format verfügbar zu machen. Da es sich um fortlaufende Arbeiten handelt, werden relevante Zwischenergebnisse (Datenpakete) im Abstand von 4 - 6 Monaten an praktisch alle Verbmobil-Partner exportiert.

Nähere Informationen:


[vorhergehendes Teilprojekt] [nächstes Teilprojekt] [Veröffentlichungen]


© Webmaster