Task #3803
closed
Task #3633: Etapa 01 - Příprava dat a datových struktur, testy existujících metod
OCR - jazykový model v Tesseractu
Added by Zajíc Zbyněk about 9 years ago.
Updated over 5 years ago.
Estimated time:
(Total: 0.00 h)
Description
aktualizovat LM v Tesseractu, tak aby jsme z něj mohli dostat eventuálně: slovní/znakový přepis, lattice
- Assignee changed from Neduchal Petr to Soutner Daniel
- zatím lze získat z OCR jen 1Best hypotézu, ale zle získat fonémový lattice (slovní lattice asi nedostupný) - lze pak zpracovat vlasním LM
- zapojení vlastního LM nahráním trénovcacích dat
DS- doplnit data do Tesseractu a vyzkouší zpracovat lattice vlastními metodami
z lattice vygenerovat slovní přepis (doplnit např. konfuzní tabulku, ...)
vygenerovat a poslat JŠ mřížky
Mřížky poslány JŠ, jsou tady: /data-kky/public/dsoutner/ocr-lattice
- Assignee changed from Soutner Daniel to Neduchal Petr
- Status changed from Assigned to Closed
Also available in: Atom
PDF