Schuzka17-05-05¶
účast: JŠ, PI, JVP, LM, ZZ, LSK, PNe, DS
OCR¶
- PNe - otestováno předzpracování: RGB binarizace - nejlepší 84% uspěsnost na znakách vyhodnocená z Tesseractu z první Nbest
- DS - získána znaková lattice z Tesseractu (Task #3803) z LM z novin
dodělat: - zlepšit LM (z podobných dat co jsou v dokumentech-scan), zkusit získat elektronické přepisy z ÚSTRU - PI (Task #3932)
- z lattice vygenerovat slovní přepis (doplnit např. konfuzní tabulku, ...) - DS (Task #3803)
- zkusit vygenerovat umělá data z existujících přepsaných dokumentů - MH (Task #4198)
- spojování skenů do dokumentů - PNe (Task #4062)
AM¶
- JVP NN model z Amalachu - otestovaný 35%->50%
Diarizace¶
- rozdělit dva řečníky (dotazovač/odpovídač) ... výsledek py s knihovnama dll - ZZ (Task #4199)
Články¶
- zkusit publikovat (Článek / prezentace projektu) na KIV-konferenci - ZZ (Task #4200)