Категория
Информатика
Тип
реферат
Страницы
8 стр.
Дата
30.01.2009
Формат файла
.rtf — Rich Text Format (Wordpad)
Архив
18235.zip — 26.79 kb
  • strukturnye-metody-raspoznavanija-slozhnoorganizovannyx-istoricheskix-tablichnyx-form_18235_1.rtf — 172.92 Kb
  • Readme_docus.me.txt — 125 Bytes
Рейтинг
10  из 10
Оценок
1
Оцените работу
Хорошо  или  Плохо


Текст работы

Структурные методы распознавания сложноорганизованных исторических табличных форм
В.М. Кляцкин, Е.В. Щепин, К.М. Зингерман, В.В. Лазарев
Аннотация
Данная работа посвящена проблематике структурного распознавания сложных табличных форм, встречающихся в исторических источниках. Предложена оригинальная модель "связанных иерархий", в рамках которой может быть распознано и описано обширное семейство табличных форм и бланков. Применение модели "связанных иерархий
" в табличном структуризаторе OCR-системы Cript позволило успешно распознавать сложноструктурированные табличные формы из различных исторических источников [1].
Введение
Сфера применения систем оптического распознавания непрерывно расширяется не только вширь (по различным областям человеческой деятельности), но и вглубь (по уровню сложности
вводимых документов). Уровень сложности зависит от многих факторов и может быть охарактеризован с точки зрения содержания вводимых листов (структура представленной на листе информации, шрифты и другие типографские
параметры), качества печати и условий сканирования. Спектр доступных для
оптического распознавания структур печатных листов достаточно широк,
и тем не менее им не исчерпываются потребности практического использования OCR для распознавания различных исторических источников. В данной работе проведен обзор современных методов структурного распознавания печатной продукции и предпринята попытка расширить диапазон автоматически обрабатываемых OCR- системами структур документов в сторону сложнооорганизованных табличных форм, распространенных в исторических исследованиях. Подлежащие обработке таблицы могут обладать многоуровневой горизонтальной и вертикальной иерархиями, уровни которых могут иметь нерегулярную (не всегда линейно



Ваше мнение



CAPTCHA