Inhalt des Dokuments
Sprach-Qualitätsmaße auf Attributbasis (DFG)
[1]
- © Copyright??
Motivation und Projektbeschreibung
Eine ausreichende Kommunikationsqualität eines
Sprachdienstes ist eine notwendige Bedingung für dessen Akzeptanz. In
modernen Telekommunikationsnetzen kann allerdings eine Vielzahl von
Faktoren die Qualität der übertragenen Sprache beeinträchtigen.
Beispiele sind lineare Verzerrungen, (niederbitratige) Codecs,
Verzögerungen, Echos, Paketverluste bei VoIP-Verbindungen oder die
Signalverarbeitung verschiedenartiger Endgeräte. Das DFG
Forschungsvorhaben zielt auf die Entwicklung eines neuen
signalbasierten Verfahrens zur Vorhersage der Sprachqualität moderner
Telekommunikationsnetze. Als Grundlage dient die Idee, die
wahrgenommene Sprachqualität als eine Komposition aus verschiedenen
für die Qualität relevanten Attributen zu verstehen. Um
Sprachqualität bzw. die einem Qualitätsurteil zugrunde liegenden
perzeptiven Komponenten (Attribute) zu messen, sind zunächst
subjektive Tests, d.h. Experimente mit Versuchspersonen erforderlich.
Daraus können Vorhersagemodelle abgeleitet werden, mit deren Hilfe
die Sprachqualität und deren perzeptive Attribute anhand von
korrelierenden physikalischen Parametern oder
Sprachsignaleigenschaften instrumentell geschätzt werden kann. Durch
diese instrumentelle Erfassung kann so die vom Benutzer wahrgenommene
Sprachqualität vorhergesagt werden. In diesem Projekt werden
insbesondere solche Netzkomponenten betrachtet, für die bekannte
instrumentelle Qualitätsschätzer nur unzureichende Ergebnisse
liefern, z.B. paketbasierte Übertragungssysteme, die zeitlich
instationäre Störungen hervorrufen. Modernste
Signalverarbeitungsverfahren, u.a. für Kodierung oder Störreduktion,
gehen bezüglich der Signalbandbreite nicht über das
"klassische" Telefonband von knapp 3,5 kHz hinaus. Der
Übergang zu paketbasierten Netzen bei allen großen Betreibern und
die damit ermöglichte universelle Datenübertragung rechtfertigen die
Annahme, dass Sprachübertragung mit verdoppelter Bandbreite (z.B. 50
- 7000 Hz) vor dem Durchbruch steht. Auch diese Effekte werden in der
Forschungsarbeit berücksichtigt, um neue Erkenntnisse in der
Wahrnehmung der "Breitband-Sprachübertragungsqualität" zu
gewinnen. Erwartete Ergebnisse
- Signal-basiertes Verfahren für die Vorhersage von Sprachqualität auf der Grundlage der instrumentellen Schätzung perzeptiver Dimensionen
- Erweiterung bestehender Netzwerkplanungsmodelle (z.B. des sog. E-Modells) auf neuartige Störungen
Dauer: | 04/2005 -
03/2008 |
---|---|
T-labs
Mitarbeiter: | Sebastian Möller, Alexander Raake
[2], Marcel Wältermann
[3] |
Studenten: | Ulrike Stiefelhagen |
Partner: | Lehrstuhl für
Netzwerk- und Systemtheorie, Christian-Albrechts-Universität, Kiel
[4] |
Förderung
durch: | Deutsche Forschungsgemeinschaft
(DFG) [5]MO 1038/2-1 und MO 1038/5-2 |
Veröffentlichungen: | siehe Veröffentlichungsliste von
Möller/Raake [6]/Wältermann [7] |
/attr_based_model_01.jpg
nder_raake/parameter/de/font1/maxhilfe/
l_waeltermann/parameter/de/font1/maxhilfe/
nder_raake/parameter/de/font1/maxhilfe/
l_waeltermann/parameter/de/font1/maxhilfe/