Project management of NTIS P1 Cybernetic Systems and Department of Cybernetics | WiKKY

Project

General

Profile

Actions

Task #3957

closed

Task #3633: Etapa 01 - Příprava dat a datových struktur, testy existujících metod

OCR - čtení hlavičky/nadpisu dokumentu

Added by Zajíc Zbyněk almost 8 years ago. Updated over 5 years ago.

Status:
Closed
Priority:
Normal
Assignee:
Start date:
27.06.2016
Due date:
31.10.2016
% Done:

100%

Estimated time:

Description

k určení tématu/klasifikace dokumentu

Actions #1

Updated by Neduchal Petr almost 8 years ago

  • Due date changed from 30.09.2016 to 31.08.2016
  • Assignee changed from Hrúz Marek to Neduchal Petr

analýza lokace, velikosti textového bloku...
čtení a zjištění co v tom je.

Actions #2

Updated by Zajíc Zbyněk over 7 years ago

  • Due date changed from 31.08.2016 to 31.10.2016
Actions #3

Updated by Neduchal Petr over 7 years ago

  • % Done changed from 0 to 60

Provedena řada pokusů založených výhradně na vlastnostech obrazu (velikost textového bloku, počet znaků v textovém bloku, druh znaků, atp). Při kvalitním rozpoznání většinou dobré výsledky. Problém nastává při nerozpoznání bloku (spojení s jiným blokem) či špatném rozpoznání textu. To se dá odstranit lepším rozpoznáváním, lepším předzpracováním (také řešíme).

Pravděpodobně bude také potřeba projít dokumenty a vytvořit seznam typů dokumentů. Na to zkusím vymyslet metodiku tak aby se do toho mohlo pustit více lidí a nedocházelo k zavádění různých tagů pro jeden druh dokumentu.

Actions #4

Updated by Neduchal Petr over 5 years ago

  • Status changed from Assigned to Resolved
  • % Done changed from 60 to 100

Resolved --> Task je díky velkému rozptylu ve vzhledu dokumentů těžko vyřešitelný. Možná by v něm šly využít anotace tagů, které se před nedávnem dělaly. Stejně by ale zůstal problém velkých rozdílů ve vzhledu dokumentů

Actions #5

Updated by Zajíc Zbyněk over 5 years ago

  • Status changed from Resolved to Closed
Actions

Also available in: Atom PDF