direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Sie sind hier

TU Berlin

Page Content

There is no English translation for this web page.

Sprachkommunikation (Sprachsignalverarbeitung und Sprachtechnologie)

Integrierte Veranstaltung
(Möller; 4 SWS, 6 LP, jeweils im WiSe)
VL-Nummer: 0434 L 900
Zeit: VL: Montags, 10.00-12.00 Uhr, erstmalig am 22.10.2012
UE: Donnerstags 16.00-18.00h, erstmalig am 1.11.2012
Raum: Auditorium 1, Geb. TEL, 20. Etage


Eine Anmeldung auf der ISIS Kursseite ist erforderlich. Näheres dazu in der ersten Vorlesung.

Am 25.10. findet statt der Übung eine Vorlesung statt!

Themen:
Sprachsignale und Sprachlaute; menschliche Spracherzeugung; Sprachsignalanalyse; auditive Wahrnehmung; Sprachsignalübertragung und Kodierung; Spracherkennung und Sprechererkennung; Sprachsynthese; Sprachdialogsysteme; multimodale Dialogsysteme.

Übersicht:
Sprache ist das wichtigste Kommunikationsmittel des Menschen, und es entwickelt sich zunehmend auch zu einer wichtigen Modalität bei der Mensch-Maschine-Interaktion. So sind bereits heute Systeme verfügbar, die über eine Spracherkennung, eine Interpretation sprachlicher Inhalte, eine Steuerung des Dialogverlaufes, eine Generierung von Antworten, sowie eine Erzeugung von Sprachsignalen verfügen. Darüber hinaus kommt der effizienten Übertragung von Sprache eine überaus große Bedeutung zu, sowohl in herkömmlichen als auch in paketvermittelten Netzen (bspw. Voice over IP).

Im Rahmen dieser Vorlesung sollen die Grundlagen für das Verständnis und die Gestaltung kommunikationstechnischer System gelegt werden, die auf Sprache beruhen. Ausgangspunkt dazu ist die Erzeugung und die Wahrnehmung natürlicher Sprache durch den Menschen, da sich hieraus viele wichtige Eigenschaften von Sprachsignalen sowie Anforderungen an ihre Verarbeitung ergeben. Hierzu werden die Grundlagen einer Beschreibung von Sprachsignalen im Zeit- und Frequenzbereich gelegt. Auf Basis dieser Grundlagen wird die Funktion wichtiger Komponenten sprachtechnologischer Systeme erläutert. Neben der effizienten Kodierung von Sprache stehen dabei die Spracherkennung, die Sprachsynthese sowie die Interaktion mittels sprachverarbeitender Systeme (Sprachdialogsysteme, auch Voice User Interfaces) im Mittelpunkt. Abschließend wird gezeigt, wie solche Systeme mittels multimodaler Ein- und Ausgabeschnittstellen noch besser an die menschlichen Kommunikationsbedürfnisse angepasst werden können (multimodale Dialogsysteme).

Zielgruppe:
Die Vorlesung richtet sich gleichermaßen an Studierende der Elektrotechnik, der technischen Informatik sowie der Informatik. Darüber hinaus sind auch Studierende aus den Sprach- und Kommunikationswissenschaften, der Technischen Akustik, der Soziologie und dem Bereich Human Factors sowie aus anderen Fachbereichen herzlich willkommen. Die Vorlesung setzt keine Vorkenntnisse im Bereich der Signalverarbeitung oder der Linguistik voraus.

Zusatzinformationen / Extras

Quick Access:

Schnellnavigation zur Seite über Nummerneingabe

Auxiliary Functions