Výskum

Všeobecným cieľom navrhovaného projektu je posunúť hranice poznania v oblasti analýzy, automatického rozponávania a syntézy reči v slovenskom jazyku. Ciele projektu sú zamerané na problematiku základného výskumu v oblasti rečových technológií pre telekomunikačné hlasom riadené systémy a aplikácie s potenciálnym dopadom na použitie výsledkov tohto výskumu aj v ďalších aplikačných oblastiach rečových technológií, ako je napr. automatická transkripcia reči, prehľadávanie rečových databáz, automatický jazykový preklad, sémantický web a pod. Ciele projektu sú striktne zamerané na slovenský jazyk a možno ich zhrnúť do troch tematických okruhov:

  1. Prvým tematickým okruhom je automatické rozpoznávanie reči, kde cieľom výskumu bude:  
    1. Návrh nových metód implementácie robustných akustických modelov pre telefónne aplikácie z korpusov SpeechDat-Sk a MobilDat-Sk a ich testovanie objektívnymi metódami a subjektívne použitím v experimentálnej výskumnej platforme „Inteligentné rečové komunikačné rozhranie” (IRKR) [http://irkr.tuke.sk/], vyvinutej v rámci úlohy štátneho programu 2003 SP 20 028 01 03 členmi riešiteľského konzorcia.
    2. Vytvorenie (zber a spracovanie) akustického korpusu nahrávok televízneho resp. rozhlasového spravodajstva, mítingov, debát a „talkshow” v slovenskom jazyku v rozsahu min 150 hodín a textového korpusu v rozsahu minimálne 150M slov, zostaveného z dostupných elektronických zdrojov, najmä Internetu.
    3. Návrh systému automatického rozpoznávanie plynulej slovenčiny (LVCSR) pomocou stochastických akustických a jazykových modelov, vytvorených z akustického korpusu televíznych a rozhlasových nahrávok v slovenčine; a z korpusu zozbieraných textových dát.
    4. Dalšie skúmanie a aplikovanie pokrokových metód a algoritmov predspracovania, trénovania, adaptácie s dôrazom na zvýšenie robustnosti v telekomunikacných aplikáciách so zohladnením akustických a lingvistických osobitostí slovenského jazyka. Zameriame sa najmä na uplatnenie neurónových sietí, morfologickej analýzy, modelovanie dlžky fonetických jednotiek a kombináciu fonémového a grafémového prístupu ARR.
  2. Druhým tematickým okruhom je syntéza reči, kde cieľom výskumu bude:
    1. Návrh novej metódy konkatenatívnej syntézy z obmedzeného množstva elementov, založenej na novej, rozšírenej sade prvkov (alofón, difón, trifón atď.), novom modeli prozódie a prepracovaných pravidlách spájania, čo umožní vytvoriť syntézu blížiacu sa prirodzenosťou korpusovej syntéze z veľkého rečového korpusu.
    2. Návrh a overenie novej metódy korpusovej syntézy s vyššou nezávislosťou od vstupného textu (unlimited domain). Veľký obsah rečového materiálu v korpuse zabezpečí vysokú prirodzenosť reči s uplatnením modelu prozódie už pri samotnom výbere elementov a znížením dodatočného spracovania signálu (postprocessingu) na minimálnu mieru pre zachovanie výnimočnej miery prirodzenosti.
    3. Modelovanie suprasegmentálnych javov v slovenčine s cieľom navrhnúť dokonalejší model slovenskej prozódie (intonácie, dĺžok hlások, atď.) pre účely syntézy reči
    4. Výskum a modelovanie expresívnych javov reči (personality, nálady a emócií) a hľadanie prístupu k expresívnej syntéze „konkatenatívnym” aj korpusovým syntetizátorom
  3. Tretím tematickým okruhom je oblasť spracovania prirodzeného jazyka, modelovania a riadenie dialógu v rečových dialógových systémoch, kde cieľom výskumu bude:
    1. Štúdium nových, pokrocilejších modelov riadenia dialógov, umožnujúcich tvorbu užívatelsky príjemnejších a spolahlivejších hovorových dialógov cloveka so strojom. Pozornost sústredíme na dialógy so zmiešanou iniciatívou, DDL jazyky (VoiceXML, SALT) a techniky založené na nových prístupoch k spracovaniu prirodzeného jazyka s využitím lingvistickej analýzy (syntaktickej a sémantickej analýzy), plánovaní, „form filling” a softvérových agentoch.
    2. Štúdium nových, pokrocilejších modelov riadenia dialógov, umožnujúcich tvorbu užívatelsky príjemnejších a spolahlivejších hovorových dialógov cloveka so strojom. Pozornost sústredíme na dialógy so zmiešanou iniciatívou, DDL jazyky (VoiceXML, SALT) a techniky založené na nových prístupoch k spracovaniu prirodzeného jazyka s využitím lingvistickej analýzy (syntaktickej a sémantickej analýzy), plánovaní, „form filling” a softvérových agentoch.
    3. Štúdium problematiky evaluácie a testovania recových dialógových systémov. Návrh metodiky evaluácie a testovania, založenej na kombinácii automatického a subjektívneho (dotazníkového) testovania a jej overenie na experimentálnej platforme IRKR.