direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Sie sind hier

TU Berlin

Inhalt des Dokuments

Entwicklung einer synthetischen Stimme einer Corporate Voice auf Basis eines vorliegenden Sprachkorpus und deren Optimierung mittels instrumenteller Schätzer (TTS Corporate Voice)

Motivation und Projektbeschreibung

Die richtige Stimme sorgt für Wiedererkennung und verleiht einer Marke Charakter. Deshalb beschäftigen große Unternehmen häufig einen festen Sprecher, durch dessen Stimme sie in Radio- und TV-Werbesports vertreten werden. Eine solche Markenstimme ist eine spezifische Sprechstimme, die konsequent und langfristig für die verbale Kommunikation eines Unternehmens eingesetzt wird. Diese für den Zuhörer bekannte Stimme wird intuitiv mit dem jeweiligen Unternehmen verknüpft. Zu solchen Stimmen liegen in den jeweiligen Unternehmen oft bereits größere Datenbanken mit aufgezeichneten Sprachdaten vor, allerdings lässt sich damit nicht jede gewünschte Äußerung erstellen. In diesem Projekt soll aus einer solchen Datenbank eine synthetische Stimme für beliebige Äußerungen erzeugt werden, welche flexibel und dynamisch eingesetzt werden kann.

Hierzu sind grundlegende Forschungsarbeiten notwendig. Durch den Einsatz neuer instrumenteller Qualitätsschätzer (ein Algorithmus, der die von einem Nutzer empfundene Qualität vorhersagt) für Gesamtqualität sowie relevante perzeptive Qualitätsdimensionen soll die Sprachsynthese während der Entwicklung nicht nur kontinuierlich verbessert werden, es werden zudem auch die Menge der anfallenden Hörversuche zur Qualitätsbestimmung der Synthese auf ein Minimum reduziert. Im Ergebnis wird eine evaluierte Sprachsynthese der Corporate Voice vorliegen, die beliebigen Text in Sprache umsetzen kann.

 

 

Fragestellungen

    Die von diesem Forschungsvorhaben angestrebten Ziele sind wie folgt definiert:

    • Bereitstellen eines eingepflegten, annotierten und ergänzten Sprachkorpus als Basis für die Weiterverarbeitung innerhalb einer Sprachsynthese.
    • Bereitstellen von Qualitätsbewertungen zweier auditiver Evaluationen.
    • Bereitstellen eines trainierten Qualitätsschätzers für Gesamtqualität sowie perzeptive Qualitätsdimensionen.
    • Bereitstellen einer Sprachsynthesesoftware mit integriertem Qualitätsschätzer zur Auswahl der Sprachbausteine.
    • Bereitstellen einer Sprachsynthese der Corporate Voice zu Generierung von Sprache aus beliebigem Rechtschrifttext.
    Dauer:

    03/2014 - 12/2015
    Mitarbeiter:
    Florian Hinterleitner
    Studenten:
    Iason Georgakopoulos
    Partner:
    Software Campus
    Förderung durch:
    Bundesministerium für Bildung und Forschung (BMBF) - 01IS12056
    Veröffentlichungen:
    siehe Veröffentlichungsliste von Hinterleitner

    Zusatzinformationen / Extras

    Direktzugang

    Schnellnavigation zur Seite über Nummerneingabe