Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Уровни понимания текста. Машинное понимание текста.

Читайте также:
  1. II. Речевая деятельность человека. Создание текста. Коммуникативные качества хорошей речи и способы их достижения
  2. III. Реферирование текста.
  3. VI. БИОГЕОЦЕНОТИЧЕСКИЙ И БИОСФЕРНЫЙ УРОВНИ ОРГАНИЗАЦИИ БИОЛОГИЧЕСКИХ СИСТЕМ
  4. Акмеологическое понимание человека как индивида
  5. Анатомия и медицина. Значение анатомических знаний для понимания механизмов заболеваний, их профилактики, диагностики и лечения.
  6. билет. Уровни маркетинга взаимоотношений.
  7. Билет№ 28:Марксистское понимание истории: понятие общественно-экономической формации и способа производства.
  8. БИЛЕТ№1-Сущность жизни и свойства живого. Уровни организации живого.
  9. Блок II. Уровни и единицы языковой системы.
  10. В каждом Роду должно быть взаимопонимание и взаимоподдержка.

Что означает «понять содержание текста»? И одинаково ли должны (или могут) понищать текст ЭВМ и человек?

При распознании смысла текста человек опирается на знание таких факторов как знание язика и знание ситуации.Если человек не ориентируется в ситуации, то он может осуществить лишь «лингвистическое (неполное) распознавание смысла». Примером полного и неполного понимания смысла текста может быть перевод одного и того же литературного произведения двумя переводчиками, прекрасно владеющими языком оригинала, из которых первый знает исторические условия создания текста, знаком с литературной традицией, а второй не обладает этими знаниями.

Оценка общего ситуационного контекста имеет решающее значение при распознавании смысла художественного текста. Машине не доступен глобальный уровень понимания текста, так как текст порождается не только системой языка, но и независимой от него ситуацией.

Определение лингвистического уровня понимания текста машинной возможно только с точки зрения пользователя системы. Чем больший процент информации из текста пользователь может получить в результате перевода, тем выше уровень понимания у ЭВМ. Низшими уровнями являются:

- Грамматический, на котором распознается грамматическая схема предложения

- Словарный, на котором распознается только лексическое значение словоформы

- Более высокий уровень – при котором устанавливаются значения целых словосочетаний, но не определяются грамматические святи между ними.

- Лексико-грамматическое понимание текста.

Последовательность операций, которые выполняются в системе машинного перевода:

1. На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например дательного падежа множественного числа) во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы.

2.Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических (морфологических, синтаксических, семантических и лексических) характеристик элементов входного текста (например, числа существительных, времени глагола, синтаксических функций словоформ в данном тексте и пр.), производимое в рамках входного языка; разрешение омографии (конверсионной омонимии словоформ – скажем, англ. round может быть существительным, прилагательным, наречием, глаголом или же предлогом); лексический анализ и перевод лексем. Обычно на этом этапе однозначные слова отделяются от многозначных (имеющих более одного переводного эквивалента в выходном языке), после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие/отсутствие контекстных определителей значения.

3. Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типа сани, ножницы глагол должен стоять в форме множественного числа, при том что в оригинале может быть и единственное число).

4. Синтез выходных словоформ и предложения в целом на выходном языке.

В зависимости от особенностей морфологии, синтаксиса и семантики конкретной языковой пары, а также направления перевода общий алгоритм перевода может включать и другие этапы, а также модификации названных этапов или порядка их следования, но вариации такого рода в современных системах, как правило, незначительны. Анализ и синтез могут производиться как пофразно, так и для всего текста, введенного в память компьютера; в последнем случае алгоритм перевода предусматривает определение так называемых анафорических связей (такова, например, связь местоимения с замещаемым им существительным – скажем, местоимения им со словом местоимения в самом этом пояснении в скобках).




Дата добавления: 2014-12-15; просмотров: 54 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав