Výstupy a etapy projektu¶
Výstupy projektu
hlavní - 2xR(SW), vedlejší - 9xD(článek v časopise, konf. 2017-2019)
ALIGN - 2017 - software pro podporu poloautomatického zarovnání nahrávek s existujícími přepisy pro účely efektivní přípravy dat určených pro trénování akustických a jazykových modelů.
HIDOAR - 2019 - software pro poloautomatické zpracování a zpřístupnění textových a zvukových nahrávek v integrovaném archivu pramenů.
Budoucí uživatelé - Post Bellum - portál Paměť národa
- 01 - Příprava dat a datových struktur, testy existujících metod (zač.2016-03-01 - kon. 2016-12-31 - odevzdání výsledku 2017-12-31)
ZČU: Vývoj softwaru ALIGN, testy existujících metod OCR, vývoj metod zpracování přirozeného jazyka pro potřeby archivu
UK: Návrh metadatových schémat repozitáře, testy metod zpracování textu
USTR: Návrh struktury metadat z pohledu badatelů, anotace nahrávek
výstup: R – sw ALIGN, D – článek ve sborníku (plán UK: konference LREC/ACL-EACL/ TLT 2016)
- 02 - Adaptace modelů a softwarových nástrojů (2017-01-01 - 2017-12-31 - 2017-12-31)
ZČU: Adaptace akustických a jazykových modelů, vývoj softwaru pro úpravy výstupu z OCR metodami zpracování přirozeného jazyka, testy metod detekce tématu
UK: Adaptace repozitáře, vývoj metod hloubkové analýzy textu pro potřeby archivu
USTR: Anotace nahrávek, konzultace metadatové struktury, příprava dokumentů ke zpracování
výstup: 3xD – článek ve sborníku (plán 2xZČU: konference EU/ konference TSD 2017 + 1xUK: EU konference 2017)
- 03 Integrace modulů a softwarových nástrojů (2018-01-01 - 2018-12-31 - 2018-12-31)
ZČU: Vývoj rozhraní mezi vyhledávacím modulem a repozitářovým softwarem, integrace metod zpracování přirozeného jazyka, OCR a detekce tématu do výsledného softwaru HIDOAR
UK: Integrace systému HIDOAR, testy metod hloubkové analýzy textu pro potřeby archivu
USTR: Příprava nahrávek a dokumentů z jiných zdrojů, předběžné užitvatelské testování jednotlivých softwarových modulů
výstup: R – sw HIDOAR, 2xD – článek ve sborníku (plán 1*ZČU: konference INTERSPEECH/SPECOM/ICASSP 2018 + 1xUK: EU konference 2018)
- 04 Testování a ladění integrovaného archivu, rozšíření dat a metadatového popisu (2019-01-01 - 2019-12-31 - 2019-12-31)
ZČU: Testy integrovaného systému HIDOAR, testy a úpravy metod rozpoznávání, indexace, vyhledávání, zpracování přirozeného jazyka, OCR a detekce tématu
UK: Závěrečné ladění a úpravy integrovaného systému HIDOAR, testy a úpravy metod hloubkové analýzy textu
USTR: Uživatelské testování integrovaného systému, metadatový popis dat s využitím softwaru HIDOAR
výstup: 3xD – článek ve sborníku (plán 2xZČU: konference EU/ konference TSD 2019+INTERSPEECH/SPECOM/ICASSP 2019 + 1xUK: konference USA/Kanada 2019)