Project management of NTIS P1 Cybernetic Systems and Department of Cybernetics | WiKKY

Project

General

Profile

Schuzka17-11-08

účast: LM, ZZ, PI, AP, JŠ, JVP, JNo, PSa, JNe, LSK, DS, LBu, MHr, PNe

GUI

  • dodělat vyhledávání na fonémech
  • zobrazování naskenovaných listinných dokumentů (tj. "obrázků")
  • domluvit se s PSa na harmonogramu práce - schůzka leden 2018

AM

  • JVP má málo akustických trénovacích dat
    • po schůzce domluva s PI, že se použijí existující přepisy od USTR, které sice nejsou zarovnané na úrovni vět (a asi ani doslovně přesné), ale s tím si JVP podle vlastních slov poradí
  • vyzkoušet v Kaldi adaptaci - DS, do konce února 2018 otestovat - (Task #4323)
  • na konci srpna 2018 je třeba mít použitelný AM

LM

  • lze dle AP považovat za vyřešený

Témata (Task #3802)

  • vstupní data rozsekat na cca 2.min. dokumenty s nějakým překryvem
  • uživatel klikne do nahrávky a z okolí +-1 min se vytvoří hledaný dokument
  • nalézt N nejpodobnějších dokumentů k hledanému
  • aplikovat jednu z metod z LSk disertačky
  • s JS domluvit formát uložených indexů slov d DB

OCR

  • PNe sloučení blízkých dokumentů - 60-75% úspěšnost (Task #4062)
  • Mhr generování syntetických dat (Task #4198)
    • PNe pozadí
    • LBu text
      • dodělat dělení slov, plavání písmen na řádce, detekovat font našich dat