Project management of NTIS P1 Cybernetic Systems and Department of Cybernetics | WiKKY

Project

General

Profile

Tématický okruh 4: Fonetické vlastnosti řeči a jejich využití při syntéze řeči

Koordinátor: FF UK, Praha

Popis

Význam statistických metod a metod strojového učení v poslední době stále vzrůstá a díky existenci mnoha vydatných řečových korpusů je možné je využít k takřka automatické přípravě inventářů řečových jednotek. Při následné vlastní syntéze řeči pak bývá trendem v zásadě pracovat jen s informacemi v korpusech obsaženými a ve stále menší míře se využívá obecných lingvistických, popř. fonetických znalostí. V rámci předkládaného projektu chceme využít jedinečný potenciál řešitelského týmu a oba přístupy efektivně skloubit. Vyjdeme přitom i z předchozích výsledků, např. z rozsáhlých studií glotalizačních jevů, výzkumu temporálních a spektrálních vlastností hlásek. V rámci projektu se výzkumné aktivity budou zaměřovat na fonetické aspekty vedoucí ke zvyšování přirozenosti a vysokému stupni přijatelnosti syntetizované řeči, zejména na identifikaci akustických parametrů (např. barva hlasu, spektrální sklon či charakteristiky formantů) percepčně relevantních pro dojem plynulé návaznosti volených řečových jednotek v syntetické řeči vytvářené metodou dynamického výběru jednotek a na analýzu používaných zvukových inventářů s cílem lokalizovat lingvisticky nesystémové řečové prvky, které se ve výsledné syntetizované řeči mohou projevovat jako parazitující, rušivé zvuky.

Cíle a postupy

  • Fonetická analýza zdrojových nahrávek: identifikace lingvisticky nesystémových řečových prvků a zobecnění nedostatků; experimentální ověření bude provedeno v TO1 (2009).
  • Fonetická variabilita realizace rázu jako fonologické kategorie: analýza, popis a vytvoření typologie vhodné pro účely syntetizované řeči; analýza a popis funkcí neutrálního vokálu v souvislé řeči a zjištění míry jeho přijatelnosti v různých kontextech (například ve funkci fortifikace předcházející hlásky, vliv na standardní asimilaci znělosti) (2009-2010).
  • Výzkum možností zvýšení percepční homogennosti řetězených jednotek (ověřování dojmu plynulosti pomocí percepčních testů, výběr a analýza kritických míst, identifikace a popis percepčně významných parametrů; návrh foneticky relevantních parametrů, syntéza řečových jednotek s rozdílnými hodnotami těchto parametrů, ověřování jejich percepční významnosti) (experimentální ověření bude provedeno v TO1) (2010-2011).
  • Návrh a ověření metodologie pořizování emočně zabarveného zvukového materiálu pro účely syntézy emocionální řeči; zahájení výzkumu vlivu vybraných emočních stylů na spektrální charakteristiky řeči, zejména v oblasti fonačních modifikací (2011).

Výstupy