Schuzka16-04-20¶
účast: ZČU-PI,ZZ, USTR-Adam Hradílek, Jakub Daníček
DATA¶
- Předání dat na PI úložiště obsahující pro každého řečníka (prozatím na testování):
- audio wav (maximální kvalita) vygenerované z masteru, pro všechny stejná kvalita
- transkript pokud je (full/part)
- archiválie (pro OCR, bez vodoznaku)
- další relevantní texty
- bez master videa
- V průběhu dojde k ořezání videí, k nim se vygeneruje znovu odpovídající audio a zmenšené video pro prohlížení uživateli
TRANSCRIPT¶
- přepisy asi u desetiny řečníků (v průběhu budu přepisováni další - můžeme dodat instrukce na přepis), celkem cca 600 řečníků.
- někde nejsou doslovné (budou zvlášť v dalších relevantních textech)
- možno víc rozdělených audio k jednomu souboru přepisu
TÉMATA / KLÍČOVÁ SLOVA¶
- ÚSTR navrhne strukturu témat (strom) - ve spolupráci s námi a Pamětí národa
- upravit PIXLU k postupnému vkládání dat do databáze a otagování nahrávek/dokumentů (pro trénování aut. témat), umožnit i tagování částí nahrávky