Читайте также:
|
|
Лексический состав первых строго ограничен и зафиксирован в словаре (тезаурус), в то время как на лексический состав вторых, никаких ограничений не накладывается и он может пополняться постоянно за счет включения новых лексических единиц.
ИПЯ делиться на дескрипторные индексирование и классификационные рубрицирование.
На сегодняшний день среди дискретных языков наибольшее распространение получили языки без грамматики и контроля по словарю – полнотекстовое индексифицирование.
В операции перевода могут выделятся два этапа:
1. Анализ смыслового содержания текста с целью выделения сведений об известных системе объектов, их свойствах а также отношений между ними.
2. Выражение этих сведений на ИПЯ то есть принятие решений о приписываемых данному сообщению на ИПЯ ПОД.
Этап анализа смыслового содержания текста связан с необходимостью использования лингвистических и экстралингвистических знаний. Лингвистические знания являются общими для первого ЕЯ. И на сегодняшний день являются достаточно хорошо формализованными, в то время как экстралингвистические сильно зависят от конкретно предметной области, а задача их формализация является одной из самых сложных. В этой связи в современных документальных системах этап анализа текста чаще всего сводиться к лингвистическому анализу, производимому с целью нормализации слов и словосочетаний. Под нормализацией слов понимается их приведение к канонической формы (Для существительного к именительному падежу, единственному числу) Под нормализацией словосочетаний понимается нормализация составляющих в данном словосочетании и записях в определенном последовательностях (Сначала основное слова, затем зависимые слова). Нормализацией слова и словосочетания обычно называются термины.
Дата добавления: 2015-01-05; просмотров: 14 | Поможем написать вашу работу | Нарушение авторских прав |