Студопедия
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Автоматическое распознавание текстов.

Читайте также:
  1. Автоматическое пеногашение.
  2. Автоматическое подведение промежуточных итогов
  3. Автоматическое регулирование технологических процессов
  4. Автоматическое списание по неоплаченным поездкам
  5. Жанровые особенности комбинированных PR-текстов, медиатекстов и смежных PR-текстов.
  6. При разработке и принятии программ широко используется метод общественно-политической диагностики (от лат. -- распознавание).
  7. Типология и жанрообразование PR-текстов.
  8. Типы ПР-текстов.
  9. Характеристика жанров первичных PR-текстов.

После обработки документа сканером получается графическое изображение документа (графический образ). Но графический образ еще не является текстовым документом. Человеку достаточно взгля­нуть на лист бумаги с текстом, чтобы понять, что на нем написано. С точки зрения компьютера, документ после сканирования превра­щается в набор разноцветных точек, а вовсе не в текстовый документ.

Проблема распознавания текста в составе точечного графического изображения является весьма сложной. Подобные задачи решают с помощью специальных программных средств, называемых сред­ствами распознавания образов. Реальный технический прорыв в этой области произошел лишь в последние годы. До этого распозна­вание текста было возможно только путем сравнения обнаруженных конфигураций точек со стандартным образцом (эталоном, храня­щимся в памяти компьютера). Подобные системы назывались OCR (Optical Character Recognition – оптическое распознавание символов)и опирались на специально разработанные шрифты, облегчавшие такой подход.

Программа FineReader выпускается отечественной компанией ABBYY Software (www.bitsoft.ru). Эта программа предназначена для распо­знавания текстов на русском, английском, немецком, украинском, французском и многих других языках, а также для распознавания смешанных двуязычных текстов.

Программа имеет ряд удобных возможностей. Она позволяет объе­динять сканирование и распознавание в одну операцию, работать с пакетами документов (или с многостраничными документами) и с бланками. Программу можно обучать для повышения качества распознавания неудачно напечатанных текстов или сложных шриф­тов. Она позволяет редактировать распознанный текст и проверять его орфографию.

Панель Scan&Read содержит кнопки, соответствующие всем этапам превращения бумажного документа в электронный текст. Пер­вая кнопка позволяет выполнить такое преобразование в единой операции. Остальные кнопки соответствуют отдельным этапам работы и содержат раскрывающиеся меню, служащие для управления соответствующей операцией.

Панель Распознавание позволяет указать язык документа и вид шрифта. Последнее требуется делать только в тех случаях, когда документ имеет недостаточное качество печати.

Панель Инструменты используют при работе с исходным изобра­жением. В частности, она позволяет управлять сегментацией документа. С помощью элементов управления этой панели задают последовательность фрагментов текста в итоговом документе.

Элементы управления панели Форматирование используют для изменения представления готового текста или при его редакти­ровании.




Дата добавления: 2015-04-12; просмотров: 167 | Поможем написать вашу работу | Нарушение авторских прав

1 | 2 | 3 | 4 | 5 | <== 6 ==> | 7 | 8 | 9 |


lektsii.net - Лекции.Нет - 2014-2026 год. (0.317 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав