Schuzka16-01-11¶
Praha-Úfal, Malostranské náměstí 25, 11800 Praha, 12:30
Předpokládaná účast:¶
- ZČU: Luděk Müller, Pavel Ircing, Zbyněk Zajíc, Marek Hrúz, Jan Švec
- ÚFAL: Jan Hajič, Martin Popel
- ÚSTR: Adam Hradilek, Jakub Stránský, Jan Dvořák
Plán schůzky:¶
- Administrativa
- podepisování smluv - podpisové kolečko
- kdo bude posílat věcnou část a kdo administrativu za ÚFAL a ÚSTR
- podpis smlouvy s MK a vzájemné smlouvy
- Skutečná práce
- kdo za co zodpovědný:
-- ÚSTR - předávání dat a jejich anotace za pomocí nástroje ALIGN (alespoň myslím - PI)
-- ÚFAL - předělání repozitáře z Lindatu pro obrazová data
-- ZČU - OCR - MH, search - JŠ, LM - AP, AM - JVP
- Témata k diskuzi
- je nějaký thesaurus (hierarchie témat) pro kategorizaci dokumentů (textových, zvukových i obrazových)?
- co budeme chtít dělat s daty:
-- automatický přepis a vyhledávání klíčových slov -- zvuk i obraz (OCR)
-- klasifikace témat
Obsah schůzky:¶
úkoly ÚSTR:
- připravit formát dat, jak se budou ukládat
- předat přepisy, textová a obrazová data přes společné úložiště (Jan Švec Task - připravit úložiště)
úkoly ÚFAL
- databáze - formát vkládaných dat, jak rozšířit LINDAT o obrazová data a pro možný uživatelský přístup vyhledávání
- Martin Popel - lematizace, morfologická analýza vět
úkoly ZČU:
- Align SW - pro zarovnavaní textu k audiu
- zpracovat dodané přepisy, data pro LM (a AM) a "zhodnotit" navrhovanou strukturu dat z ÚSTR
- možnosti OCR (ÚSTR - Jakub Daníček, ZČU - Marek Hrúz + 2 doktorandi)
Administrativa:¶
ZZ - redmine - pridat ustr a ufal - udelat interni zcu cast a eterni i pro ustr a ufal
ZZ - poslat strukturu a dokumety jake se budou ve zprave vykazovat
ZZ - poslat celou dokumentaci Hajic + Stransky emailem
ÚSTR - pošle návrh smlouvy o datech