Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Поисковые системы Интернета

Читайте также:
  1. A. 2.4. Показатели активности мышечной системы
  2. b. 2.5. Показатели активности дыхательной системы
  3. I. Общая характеристика жанровой системы связей с общественностью.
  4. I. Общее положение современной системы международных отношений.
  5. II. Патология нервной системы
  6. III. ГОСУДАРСТВО КАК ОСНОВНОЙ ИНСТИТУТ ПОЛИТИЧЕСКОЙ СИСТЕМЫ.
  7. III. Изменения микроглии (клетки системы мононуклеарных фагоцитов).
  8. III. Клинические проявления инфекционных болезней нервной системы
  9. III. Совершенствование системы мер по сокращению предложения наркотиков
  10. III. Требования к организации системы обращения с медицинскими отходами

Поисковая система — веб-сайт, предоставляющий возможность поиска информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах и тому подобное.

Как правило, основной частью поисковой системы является поисковая машина (поисковый движок) - комплекс программ, обеспечивающий функциональность поисковой системы. Основными критериями качества работы поисковой машины являются релевантность (степень соответствия запроса и найденного, т.е. уместность результата), полнота базы, учёт морфологии языка. Индексация информации осуществляется специальными поисковыми роботами

Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем из Массачусетского технологического института в 1993. Первой полнотекстовой поисковой системой (т.е. индексирующей ресурсы при помощи робота) стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице - с тех пор это стало стандартом во всех основных поисковых системах.

Яндекс. Официально поисковая машина Yandex.Ru была анонсирована 23 сентября 1997 года на выставке Softool. Через два месяца, в ноябре 1997 года, Yandex дал ответ на первый поисковый запрос. В последующие 3 года Яндекс активно развивался, появлялись новые внутренние проекты, такие как «Яндекс. Новости» или «Яндекс. Фотки». В 2000 году образована компания «Яндекс». Она была учреждена акционерами CompTek — компании, создавшей и в течение долгого времени развивавшей проект Яndex.

Google. В качестве учебного проекта двое студентов Стендфорского университета, Лари Пейдж и Сергей Брин, предложили новую поисковую систему, которая на сегодняшний день стала одной из самых влиятельных компания во всемирной сети Интернет – Goggle. Изначально студенты планировали создать удобный поисковик, благодаря которому пользователи могли бы просмотреть все ссылки, имеющие отношения к их запросу. До сих пор это считается основной целью компании Google, правда, она значительно расширила свои возможности и предлагает пользователям также услуги передачи и получения электронной почты и хранение документов. Всего за несколько лет небольшая компания Google, состоящая из двух человек, превратилась в огромную корпорацию.

Из чего состоят поисковики?

Поисковики состоят из следующих основных компонентов:

- Spider (паук) - специальная программа которая похожа на браузер и занимается скачиванием в базу данных поисковика найденные Crawler `ом новые сайты и странички в интернете. Так как Spider - это по своей сути поисковый робот, то естественно он "видит" только HTML - код страницы, без графики, баннеров, скриптов и т.п.

- Crawler («путешествующий» паук) - специальная программа, которая в автоматическом режиме осуществляет поиск новых сайтов и страниц в интернете. Основная его задача, обнаружение еще неизвестных поисковой системе документов в интернете. Crawler использует для этого уже известные сайты и переходя по имеющимся на них ссылкам. Поэтому если вы сделали свой сайт, то пока на него не существует ссылок с других источников, ваш новый сайт будет невидим для поисковиков.

Некоторые поисковики используют вместо Spider и Crawler одну программу, которая сразу и находит и скачивает информацию.

- Indexer (индексатор) - эта программа анализирует скачанные страницы на предмет их соответствия различным поисковым запросам. Полный алгоритм работы этой программы не знает ни кто. К тому же он периодически может менятся. Но общий принцип работы у всех поисковиков примерно одинаковый.

- Database (база данных) - в базе хранятся все найденные и скачанные поисковыми роботами страници сайтов. Некоторые поисковики используют общую базу данных.

- Web server (сам сайт поисковика) - то, что мы все наблюдаем в окошке своего браузера, когда вводим поисковый запрос в строку поиска. Отвечает за выдачу результатов поиска.

Как работают поисковики?

Поиск нужной информации в поисковиках происходит по ключевому слову, или словосочетанию, которые больше всего соответствуют той теме, информацию по которой необходимо найти. Именно эти слова или словосочетания вбиваются пользователями интернета в строку поиска.

Для этой цели, системы поиска (поисковики) применяют набор различных программ, выполняющих такие функции как:

- поиск сайтов;

- их классификация по соответствию тому или иному запросу;

- ранжирование сайтов по их качеству;... и многое другое.

Разные поисковики могут использовать различный алгоритм действия этих программ и по-разному распределять их функции. Но принцип действия у них у всех примерно одинаковый. Весь процесс работы поисковика, сбора обработки и выдачи информации примерно выглядит так:

Поисковый робот (паук) "бродит" по виртуальному пространству отыскивая по ссылкам новые сайты и новые страницы старых сайтов, и заносит их адреса в базу данных. Потом другой робот скачивает всё текстовое содержание этих страниц, и то же отправляет их в базу. Некоторые поисковики, как описано выше, для этой цели используют одну программу, которая и находит и скачивает новую информацию.

В базе страницы хранятся и ждут, когда их проиндексирует другая программа. После чего составляются каталоги с адресами и кратким описанием этих страниц. Уже оттуда поисковики выдают адреса страниц в порядке степени их соответствия каждому поисковому запросу пользователя.

Время, за которое поисковики успевают найти новый сайт, проанализировать его и начать выдавать по поисковым запросам, примерно составляет от нескольких недель до нескольких месяцев.

Конечно же, описанная здесь схема работы поисковиков примерная и очень упрощённая. На самом деле всё намного сложнее. Одни роботы (пауки) ищут только абсолютно новые страницы, другие только проверяют уже проиндексированные страницы на предмет изменений в них и т.д.

 


Вопросы для самоконтроля

1. Расшифровка и перевод на русский аббревиатуры WWW?

2. Год рождения World Wide Web?

3. Расшифровка и перевод на русский аббревиатуры HTML?

4. Что такое протокол?

5. Раскройте назначение протоколов TCP/IP, HTTP, FTP, POP, SMTP.

6. Понятие WEB- серверов, сайтов и страниц.

7. Что такое гиперссылка?

8. Что такое IP-адрес? Как он записывается?

9. Что такое URL-адрес? Примеры URL.

10. Назначение серверов DNS.

11. Что такое браузер?

12. Когда был выпущен первый графический браузер и как он назывался?

13. Назовите популярные браузеры?

14. Назовите достоинства и недостатки браузера Internet Explorer?

15. Назовите достоинства и недостатки браузера Opera?

16. Назовите достоинства и недостатки браузера Mozilla?

17. Что такое поисковая система?

18. Что можно искать с помощью поисковых систем?

19. Когда была создана первая поисковая система и какое название она имела?

20. Кто и когда разработал Яндекс и Google?

21. Раскройте назначение компонентов поисковиков: Spider (паук), Crawler («путешествующий» паук), Indexer (индексатор), Database (база данных).

22. Как работают поисковики?

 




Дата добавления: 2015-02-16; просмотров: 16 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2024 год. (0.008 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав