Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Поиск информации в WWW.

Читайте также:
  1. C.) К специфическим задачам, которые используются в ходе реализации частично-поисковых методов на уроке технологии, относятся
  2. Cущность и общественное значение средств массовой информации
  3. I ПОДХОД. Неизмеряемость информации в быту (информация как новизна)
  4. II. Этапы сбора и анализа информации в стратегическом менеджменте
  5. XV. Церковь и светские средства массовой информации
  6. А) действия, направленные на получение информации неопределенным кругом лиц или передачу информации неопределенному кругу лиц
  7. Анализ информации, содержащейся в отчете о движении денежных средств
  8. Базы данных, Интернет-источники, информационно-справочные и поисковые системы
  9. Базы данных, информационно-справочные и поисковые системы
  10. Базы данных, информационно-справочные и поисковые системы

Для поиска информации в Internet разрабатывались различные систе­мы, но наиболее удачные программные продукты появились в последние несколько лет. Эти системы позволяют искать информацию в Web-страницах, в группах новостей и хранилищах файлов.

Стратегия современных поисковых серверов базируется на трех ос­новных подходах :

· создании каталогов;

· создании индексов;

· гибридном методе.

Поисковые инструменты первого типа чаще всего называют предметными, или тематическими каталогами. Компания, владеющая таким каталогом, непрерывно ведет огромную работу, исследуя, описывая, каталогизируя и раскладывая по полочкам содержимое WWW-серверов и других сетевых ресурсов, разбросанных по всему миру. Результатом является постоянно обновляющийся иерархический каталог, на верхнем уровне которого собраны самые общие категории, такие как “бизнес”, ”наука”, ”искусство” и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и сервера вместе с кратким описанием их содержимого.

Предметные каталоги предоставляют и возможность поиска по ключевым словам. Однако поиск этот происходит не в содержимом самих WWW-серверов, а в их кратких описаниях, хранящихся в каталоге.

К наиболее известным предметным каталогам Internet относятся Yahoo, WWW Virtual Library, Galaxy и некоторые другие

Поддержка Web-индексов предполагает создание и непрерывное по­полнение огромной базы данных по индексируемым документам.

Существуют программы, в которые загрузили несколько тысяч общеизвестных URL-адресов. Будучи запущена на компьютере с доступом к WWW, эта программа начинает автоматически скачивать из сети документы по этим URL, причем из каждого нового документа она извлекает все содержащиеся в нем ссылки и добавляет их в свою базу адресов. Программы такого типа называются роботами. Они ограничиваются сбором статистической информации и построением словоуказателей (индексов) по текстам документов. Собираемая роботом база данных — индекс — хранит в себе сведения о том в каких WWW-документах содержаться те или иные слова.

Именно такой автоматически собираемый индекс и лежит в основе поисковых систем второго рода, которые часто так и называют — автоматические индексы. Автоматических индексов WWW-страниц существует немало: WebCrawler, Lycos, Excite, Inktomi, Open Text и другие. Некоторые из них (например, Lycos) представляют собой более или менее удачный синтез предметного каталога и автоматического индекса.

Поисковые системы глобального масштаба свое основное внимание концентрируют на англоязычных ресурсах Сети. Задачу поиска информации на серверах в пределах отдельных стран выполняют системы локального характера, специально адаптированные к особенностям конкретных языков. Существуют подобные поисковые средства и в России. Всех их объединяет возможность обработки материалов во всех кириллических кодировках.

К лидирующим в настоящее время относятся системы Rambler, АпортиЯndex.


Дата добавления: 2015-01-30; просмотров: 5 | Нарушение авторских прав

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | <== 14 ==> |


lektsii.net - Лекции.Нет - 2014-2019 год. (0.007 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав