Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Полнотекстовый поиск (автоматический поиск по словам из текста документа)

Читайте также:
  1. C.) К специфическим задачам, которые используются в ходе реализации частично-поисковых методов на уроке технологии, относятся
  2. EXCEL –де үлкен мәтінде ұяшықты өзгертпей енсіз қалай орналастыруға болады? *Формат – Ячейка – Выравнивание – Переносить по словам
  3. II. Методы прогнозирования и поиска идей
  4. II. Работа над созданием собственного текста.
  5. II. Редактирование текста
  6. II.Редактирование текста
  7. III. Закончите предложение по содержанию прочитанного текста.
  8. III. Написание текста контрольной работы
  9. IV. Выпишите из текста 10 сложных существительных и определите их род.
  10. IV. Выпишите из текста 10 существительных и определите их тип склонения.

Этот вид поиска основан на автоматической обработке текста. При запросе на поиск тех документов, где встречается конкретное слово, автоматически происходит перебор всего массива документов и выбор всех тех документов, где это слово встречается. Существуют быстрые алгоритмы такого поиска, когда при первоначальном вводе каждого документа все встречающиеся в нем слова вносятся в общий словарь, и в дальнейшем при поиске по любому слову из словаря можно мгновенно получить список всех документов, где оно встречается.

Более того, на основе полнотекстового поиска могут быть реализованы различные способы формирования поисковых запросов. Простейшим запросом является следующий: найти все документы, содержащие одно слово, например БУХГАЛТЕР. Более сложным вариантом запроса является запрос на поиск всех документов, содержащих два слова, например ГЛАВНЫЙ и БУХГАЛТЕР. Если эти два слова соединены логическим условием И, то будут отобраны только те документы, где есть одновременно оба слова. Если указаны два слова, соединенные логическим условием ИЛИ, то будут отобраны документы, где есть хотя бы одно из этих слов. Такие логические выражения могут быть еще более сложными.

При формировании сложных запросов дополнительно может использоваться признак близости слов. В запросе ГЛАВНЫЙ И БУХГАЛТЕР может быть указано, что слова должны находиться РЯДОМ, например в пределах 2 (или 3) строк.

Основное преимущество полнотекстового поиска состоит в том, что он не зависит от субъективных мнений или ошибок специалистов-разработчиков и всегда по любому слову дает возможность получить полный и абсолютно точный список документов, где встречается искомое слово. Ничего не будет забыто и пропущено. Другими словами, на любой запрос можно получить ответ, подготовленный по понятному для пользователя правилу, не зависящему от субъективной позиции обработчика,

Но, конечно, у полнотекстового поиска имеются и свои недостатки. Во-первых, полученный список будет содержать много «шума», то есть те документы, где искомое слово используется не в нужном контексте и т.п. Во-вторых, не будут найдены те документы, где встречаются синонимы данного термина. Так, задав поиск по слову НЕСОВЕРШЕННОЛЕТНИЙ, невозможно автоматически получить те документы, где используется выражение ЛИЦО, НЕ ДОСТИГШЕЕ ВОСЕМНАДЦАТИ ЛЕТ. Эта проблема частично решается усложнением задаваемых поисковых выражений, но все равно трудно во всех случаях добиться такой же точности, как при заранее проделанной «вручную» экспертной обработке (см. следующий пункт).




Дата добавления: 2015-04-26; просмотров: 28 | Поможем написать вашу работу | Нарушение авторских прав

1 | 2 | 3 | 4 | 5 | 6 | <== 7 ==> | 8 | 9 | 10 | 11 |


lektsii.net - Лекции.Нет - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав