Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Математические модели открытого текста

Читайте также:
  1. DCOR моделирование как разновидность стандарта SCOR модели.
  2. I. Стандарты текста
  3. I. Теоретические основы изучения туристских информационных систем как новой модели туристского бизнеса
  4. I.1.2. Божественное — человеческое в авторитетных текстах ислама
  5. II этап. Разработка модели
  6. II. Речевая деятельность человека. Создание текста. Коммуникативные качества хорошей речи и способы их достижения
  7. III. Написание текста контрольной работы
  8. III. Реферирование текста.
  9. VIII этап. Оформление текста курсовой работы.
  10. А) две модели развития молодёжных конфликтов – в форме интеграции и дифференциации

Потребность в математических моделях открытого текста продиктована, прежде всего, следующими соображениями. Во-первых, даже при отсутствии ограничений на временные и материальные затраты по выявлению закономерностей, имеющих место в открытых текстах, нельзя гарантировать того, что такие свойства указаны с достаточной полнотой. Например, хорошо известно, что частотные свойства текстов в значительной степени зависят от их характера. Поэтому при математических исследованиях свойств шифров прибегают к упрощающему моделированию, в частности, реальный от­крытый текст заменяется его моделью, отражающей наиболее важные его свойства. Во-вторых, при автоматизации методов криптоанализа, связанных с перебором ключей, требуется "научить" ЭВМ отличать открытый текст от случайной по­следовательности знаков. Ясно, что соответствующий крите­рий может выявить лишь адекватность последовательности знаков некоторой модели открытого текста.

Один из естественных подходов к моделированию откры­тых текстов связан с учетом их частотных характеристик, приближения для которых можно вычислить с нужной точно­стью, исследуя тексты достаточной длины. Основанием для такого подхода является устойчивость частот к -грамм или целых словоформ реальных языков чело­веческого общения (то есть отдельных букв, слогов, слов и некоторых словосочетаний).

Учет частот k-грамм приводит к следующей модели от­крытого текста. Пусть Р(k)(А) представляет собой массив, состоящий из приближений для вероятностей р(b1,b2,...,bk) появления k-грамм b 1bг...bk в открытом тексте, k N,

А = (а1,...,ап) — алфавит открытого текста, bi A, i = 1,k.

Тогда источник "открытого текста" генерирует последова­тельность с12,...,сkk+1,... знаков алфавита А, в которой k-грамма с1с2...сk появляется с вероятностью р(с1с2...сk) е Р(k)(А),

следующая k-грамма с1с2...сk+1 по­является с вероятность р(с2с3...сk+1) Р(k)(А) и т. д. Назо­вем построенную модель открытого текста вероятностной моделью k-го приближения.

Таким образом, простейшая модель открытого текста - вероятностная модель первого приближения – представляет собой последовательность знаков с12,..., в которой каждый знак ci, i = 1,2,..., появляется с вероятностью р(сi) P(1)(A), независимо от других знаков. Будем назы­вать также эту модель позначной моделью открытого тек­ста. Модели открытого текста более высоких приближений учитывают зависимость каждого знака от большего числа предыдущих знаков. Ясно, что чем выше степень приближе­ния, тем более "читаемыми" являются соответствующие мо­дели. Проводились эксперименты по моделированию откры­тых текстов с помощью ЭВМ.




Дата добавления: 2015-01-30; просмотров: 143 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав