Inhalt des Dokuments
Sprachkommunikation (Sprachsignalverarbeitung und Sprachtechnologie)
Integrierte Veranstaltung
(Möller; 4 SWS, 6 LP, jeweils im WiSe)
VL-Nummer: 0434 L 900
Zeit:
VL: Montags, 10.00-12.00 Uhr, erstmalig am
22.10.2012
UE: Donnerstags
16.00-18.00h, erstmalig am 1.11.2012
Raum: Auditorium 1, Geb. TEL, 20.
Etage
Eine Anmeldung auf der ISIS Kursseite ist erforderlich.
Näheres dazu in der ersten Vorlesung.
Am 25.10. findet statt der Übung eine Vorlesung statt!
Themen:
Sprachsignale und Sprachlaute;
menschliche Spracherzeugung; Sprachsignalanalyse; auditive
Wahrnehmung; Sprachsignalübertragung und Kodierung; Spracherkennung
und Sprechererkennung; Sprachsynthese; Sprachdialogsysteme;
multimodale Dialogsysteme.
Übersicht:
Sprache ist das wichtigste Kommunikationsmittel des Menschen, und es
entwickelt sich zunehmend auch zu einer wichtigen Modalität bei der
Mensch-Maschine-Interaktion. So sind bereits heute Systeme verfügbar,
die über eine Spracherkennung, eine Interpretation sprachlicher
Inhalte, eine Steuerung des Dialogverlaufes, eine Generierung von
Antworten, sowie eine Erzeugung von Sprachsignalen verfügen. Darüber
hinaus kommt der effizienten Übertragung von Sprache eine überaus
große Bedeutung zu, sowohl in herkömmlichen als auch in
paketvermittelten Netzen (bspw. Voice over IP).
Im Rahmen
dieser Vorlesung sollen die Grundlagen für das Verständnis und die
Gestaltung kommunikationstechnischer System gelegt werden, die auf
Sprache beruhen. Ausgangspunkt dazu ist die Erzeugung und die
Wahrnehmung natürlicher Sprache durch den Menschen, da sich hieraus
viele wichtige Eigenschaften von Sprachsignalen sowie Anforderungen an
ihre Verarbeitung ergeben. Hierzu werden die Grundlagen einer
Beschreibung von Sprachsignalen im Zeit- und Frequenzbereich gelegt.
Auf Basis dieser Grundlagen wird die Funktion wichtiger Komponenten
sprachtechnologischer Systeme erläutert. Neben der effizienten
Kodierung von Sprache stehen dabei die Spracherkennung, die
Sprachsynthese sowie die Interaktion mittels sprachverarbeitender
Systeme (Sprachdialogsysteme, auch Voice User Interfaces) im
Mittelpunkt. Abschließend wird gezeigt, wie solche Systeme mittels
multimodaler Ein- und Ausgabeschnittstellen noch besser an die
menschlichen Kommunikationsbedürfnisse angepasst werden können
(multimodale Dialogsysteme).
Zielgruppe:
Die Vorlesung richtet sich gleichermaßen an Studierende
der Elektrotechnik, der technischen Informatik sowie der Informatik.
Darüber hinaus sind auch Studierende aus den Sprach- und
Kommunikationswissenschaften, der Technischen Akustik, der Soziologie
und dem Bereich Human Factors sowie aus anderen Fachbereichen herzlich
willkommen. Die Vorlesung setzt keine Vorkenntnisse im Bereich der
Signalverarbeitung oder der Linguistik
voraus.