Project management of NTIS P1 Cybernetic Systems and Department of Cybernetics | WiKKY

Project

General

Profile

Tématický okruh 2: Modelování řečového signálu

Koordinátor: ÚFE AV ČR, Praha

Popis

Modifikace řeči na úrovni řečového signálu založená na využití vhodného řečového modelu představuje efektivní způsob, jak měnit spektrální i prozodické vlastnosti řeči. Přestože s dobře nastaveným modulem dynamického výběru jednotek potřeba modifikovat syntetizovanou řeč na signálové úrovni klesá, v jistých kontextech (málo zastoupených ve zdrojovém řečovém korpusu) a do budoucna rovněž s ohledem na modifikace stylu řeči a transformace hlasu je korektní modifikace řečového signálu stále velmi důležitá. Řešitelský tým nabyl v předchozím výzkumu i v této oblasti řadu zkušeností. V rámci předkládaného projektu se chceme zaměřit na hledání nových metod modelování řeči s důrazem na přirozenost a přijatelnost syntetické řeči za pomoci výzkumu chování hlasového traktu v různých intonačních polohách s ověřením simulacemi na fyzikálním akustickém modelu hlasového traktu. Získané poznatky plánujeme využít i při výzkumu transformace řeči s minimální degradací její kvality. Dále se chceme věnovat výzkumu emocionálních řečových stylů, jejich popisu, analýze, syntéze a transformaci.

Cíle a postupy

  • Analýza degradujících vlivů současných modelů hlasového traktu pracujících ve frekvenční oblasti při modelování intonačně bohaté řeči (2009).
  • Návrh fyzikálního akustického modelu hlasového traktu a jeho využití při modelování řečového signálu s vysokou přirozeností v různých intonačních polohách (2009-2010).
  • Modifikace stávajících řečových modelů za účelem modelování řečového signálu s vysokou přirozeností v různých intonačních hladinách a transformace řeči (2010-2011).
  • Výzkum význačných emocionálních stylů, jejich analýza, modelování a transformace (2010-2011).

Výstupy