Задание
Технология распознавания текста
- Объекты 1
- Для отсканированных документов типографского качества \(достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений\) распознавание символов проводится путем их сравнения
- При распознавании документов с низким качеством печати \(машинописный текст, факс и т\. д\.\) используется
- Системы оптического распознавания символов используются
- Для перевода документов в цифровой компьютерный формат
- Для получения документа в текстовом формате необходимо
- Системы оптического распознавания символов
- Выделенные текстовые фрагменты графического изображения страницы
- Объекты 2
- с растровыми шаблонами.
- векторный метод распознавания символов
- при создании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат
- сначала с помощью сканера необходимо получить изображение страницы текста в графическом формате
- провести распознавание текста, т. е. преобразовать элементы графического изображения в последовательность текстовых символов
- сначала определяют структуру размещения текста на странице и разбивают его на отдельные области: колонки, таблицы, изображения и т. д.
- разделяются на изображения отдельных символов.