Project management of NTIS P1 Cybernetic Systems and Department of Cybernetics | WiKKY

Project

General

Profile

Výstupy a etapy projektu

Výstupy projektu
hlavní - 2xR(SW), vedlejší - 9xD(článek v časopise, konf. 2017-2019)
ALIGN - 2017 - software pro podporu poloautomatického zarovnání nahrávek s existujícími přepisy pro účely efektivní přípravy dat určených pro trénování akustických a jazykových modelů.
HIDOAR - 2019 - software pro poloautomatické zpracování a zpřístupnění textových a zvukových nahrávek v integrovaném archivu pramenů.
Budoucí uživatelé - Post Bellum - portál Paměť národa

Etapy projektu
  • 01 - Příprava dat a datových struktur, testy existujících metod (zač.2016-03-01 - kon. 2016-12-31 - odevzdání výsledku 2017-12-31)
    ZČU: Vývoj softwaru ALIGN, testy existujících metod OCR, vývoj metod zpracování přirozeného jazyka pro potřeby archivu
    UK: Návrh metadatových schémat repozitáře, testy metod zpracování textu
    USTR: Návrh struktury metadat z pohledu badatelů, anotace nahrávek
    výstup: R – sw ALIGN, D – článek ve sborníku (plán UK: konference LREC/ACL-EACL/ TLT 2016)
  • 02 - Adaptace modelů a softwarových nástrojů (2017-01-01 - 2017-12-31 - 2017-12-31)
    ZČU: Adaptace akustických a jazykových modelů, vývoj softwaru pro úpravy výstupu z OCR metodami zpracování přirozeného jazyka, testy metod detekce tématu
    UK: Adaptace repozitáře, vývoj metod hloubkové analýzy textu pro potřeby archivu
    USTR: Anotace nahrávek, konzultace metadatové struktury, příprava dokumentů ke zpracování
    výstup: 3xD – článek ve sborníku (plán 2xZČU: konference EU/ konference TSD 2017 + 1xUK: EU konference 2017)
  • 03 Integrace modulů a softwarových nástrojů (2018-01-01 - 2018-12-31 - 2018-12-31)
    ZČU: Vývoj rozhraní mezi vyhledávacím modulem a repozitářovým softwarem, integrace metod zpracování přirozeného jazyka, OCR a detekce tématu do výsledného softwaru HIDOAR
    UK: Integrace systému HIDOAR, testy metod hloubkové analýzy textu pro potřeby archivu
    USTR: Příprava nahrávek a dokumentů z jiných zdrojů, předběžné užitvatelské testování jednotlivých softwarových modulů
    výstup: R – sw HIDOAR, 2xD – článek ve sborníku (plán 1*ZČU: konference INTERSPEECH/SPECOM/ICASSP 2018 + 1xUK: EU konference 2018)
  • 04 Testování a ladění integrovaného archivu, rozšíření dat a metadatového popisu (2019-01-01 - 2019-12-31 - 2019-12-31)
    ZČU: Testy integrovaného systému HIDOAR, testy a úpravy metod rozpoznávání, indexace, vyhledávání, zpracování přirozeného jazyka, OCR a detekce tématu
    UK: Závěrečné ladění a úpravy integrovaného systému HIDOAR, testy a úpravy metod hloubkové analýzy textu
    USTR: Uživatelské testování integrovaného systému, metadatový popis dat s využitím softwaru HIDOAR
    výstup: 3xD – článek ve sborníku (plán 2xZČU: konference EU/ konference TSD 2019+INTERSPEECH/SPECOM/ICASSP 2019 + 1xUK: konference USA/Kanada 2019)