Project management of NTIS P1 Cybernetic Systems and Department of Cybernetics | WiKKY

Project

General

Profile

Actions

Task #4482

closed

Task #3633: Etapa 01 - Příprava dat a datových struktur, testy existujících metod

Task #3803: OCR - jazykový model v Tesseractu

Balík OCR

Added by Zajíc Zbyněk over 5 years ago. Updated over 4 years ago.

Status:
Closed
Priority:
High
Assignee:
Start date:
22.10.2018
Due date:
05.11.2018
% Done:

80%

Estimated time:

Description

Připravit (v Pythonu?) balík zpracování obrazu s predzpracováním a vyhodncením zatím jen pomocí Tesseractu (bez Kaldi), 1Best hypoteza + BoundingBox

Actions #1

Updated by Neduchal Petr over 5 years ago

  • % Done changed from 0 to 80

Připravený balík obsahující cpp aplikaci využívající api Tesseractu + python balíček předán Honzovi Švecovi.

Zjištění: Tesseract 4 má lepší výsledky než předchozí verze, ovšem v současné fázi vývoje z nějakého důvodu vrací pouze one_best nikoliv alternativy i přesto že to přes API přímo požadujeme.

Předzpracování se musí ještě upravit z toho co měl Dan tak aby se spouštělo přímo v pythonu a ne z shellu --> Dodělám v tomto týdnu

Actions #2

Updated by Zajíc Zbyněk over 4 years ago

  • Status changed from Assigned to Closed
Actions

Also available in: Atom PDF