Project management of NTIS P1 Cybernetic Systems and Department of Cybernetics | WiKKY

Project

General

Profile

Schuzka16-03-09

účast: AP,JVP,JŠ,PI,MH,ZZ,LSk,PNe,LB, DS
neúčast: LM, PSa, JZ

DATA

  • výpovědi lidí k totalitě, akustika stejná jako Malach (otestovat až budou data -> JVP), k jazykovému modelu použijeme přepisy z ÚSTRU (musí se zarovnat, pak se vytvoří LM -> AP) (Task #3799)
  • přenos dat přes CESNET (cca32TB), zajistit nezálohování dat. Data pak uložena na našem poli, ale také nezálohovaná (Task #3663)
  • kde budou finálně data a SW - zda u nás se vzdáleným přístupem, nebo na ÚSTRu (Task #3776)

GUI

  • úprava pixly pro vkládání obrázku (PSt - zajistit úvazek/stipendium) (Task #3801)
  • GUI pro vkládání a prohlížení (kdo bude vytvářet SW?) (Task #3800)

Témata

  • jak budeme data popisovat (matadata)? - vymyslet Thesaurus (Schválit ÚSTRem)
  • LSk na dodaných přepisech od ÚSTRu zkusí unsupervised shlukování (Task #3802)

OCR

  • využít Tesseract (Google), aktualizovat LM v něm (DS, PNe), tak aby jsme z něj mohli dostat eventuálně: slovní/znakový přepis, lattice (Task #3803)
  • MH - vyzkoušet unsupervised shlukování obrázků pomocí NN -> jako automatická klasifikace dokumentů (Task #3804)