Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Системы оптического распознавания информации

Читайте также:
  1. A) на этапе разработки концепций системы и защиты
  2. B) наличие альтернативных источников информации;
  3. C.) При кодировании текстовой информации в кодах ASCII двоичный код каждого символа в памяти ПК занимает
  4. Cущность и общественное значение средств массовой информации
  5. EIS и DSS системы.
  6. I ПОДХОД. Неизмеряемость информации в быту (информация как новизна)
  7. I. Судебно-следственная практика формирования системы доказательств по уголовному делу (постановка проблемы).
  8. II. Этапы сбора и анализа информации в стратегическом менеджменте
  9. IV. ГОРОДСКИЕ СИСТЕМЫ ЭНЕРГОБЕСПЕЧЕНИЯ
  10. L.1.1. Однокомпонентные системы.

Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные — последовательность кодов, использующихся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слова или фразы, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения.

Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие нетекстовые компоненты.

Системы машинного перевода

Маши́нный перево́д — процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.

Формы организации взаимодействия ЭВМ и человека при машинном переводе

• С постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат.

• С предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка.

• С интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи.

• Смешанные системы (например, одновременно с пред- и постредактированием).




Дата добавления: 2015-04-26; просмотров: 10 | Поможем написать вашу работу | Нарушение авторских прав

Искажение информации и дезинформация | Производные единицы измерения компьютерной информации | Информационные процессы | Технологии работы с графической информацией | Стандарты форматов представления графических данных | Принципы формирования растровой графики | Принципы формирования векторной графики | Стандарты для оформления технической документации | Медицина | Технические средства сбора, обработки, хранения и демонстрации информации |


lektsii.net - Лекции.Нет - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав