Как работают поисковые системы
В настоящее время, в российском интернете (рунете) существует три крупнейшие поисковые системы:
- Яндекс;
- Google;
- Mail.Ru Group.
Поисковые системы созданы для облегчения поиска информации на просторах интернета. Поисковики различны по внешнему виду. На главных страницах Яндекс и Mail.Ru помимо поисковой строки можно увидеть новости, телепрограмму, сводку погоду и т. п. Google же придерживается минималистичного стиля и отображает только поисковую строку, а также кнопку для авторизации на сайте.
Несмотря на внешние отличия, принцип работы поисковых систем общий для всех. Ранее для поиска информации в Интернете использовались каталоги, в которых сайты были упорядочены по тематическим направлениям. Распределение сайтов по рубрикам осуществлялось вручную. Это было удобно, пока количество сайтов было небольшим. Но интернет рос и количество сайтов росло в геометрической прогрессии. Над распределением сайтов по рубрикам работало большое количество людей, но даже несмотря на это, поиск нужной информации в каталогах среди огромного количества сайтов одной тематики был очень затруднен.
Но в 1998 году был предложен принципиально новый подход в поиске информации. В данном подходе упор делался не на людей, а на вычислительные мощности компьютеров. Предложили данный подход студенты Стэнфордского университета Ларри Пейдж и Сергей Брин, которые в этом же году запустили поисковую систему Google.
Так как основоположником поисковых систем является Google, то именно на его примере мы разберем принцип работы поиска. Но смеем вас уверить, что на этих принципах работают все популярные поисковые системы.
Итак, сборщиками информации у поисковой системы являются роботы, их также называют пауками (по аналогии со всемирной паутиной), которые у Google называются GoogleBot. Работы переходят по ссылкам в интернете и создают копии страниц которые посещают. Данная копия страницы сохраняется в компьютеризированном каталоге на серверах Google.
Когда пользователь вводит в поисковую строку свой запрос, система ищет совпадения в каталоге и выводит результат в виде ссылок и краткой выжимки из содержания. Вверху располагаются результаты, которые наиболее точно соответствуют запросу. Их называют наиболее релевантной поисковой выдачей.
Именно поэтому, если вы создали сайт, то его нужно добавить в поисковые системы для того, чтобы роботы начали путешествовать по ссылкам нового сайта и отправлять сохраненные копии страниц на свои сервера, где они будут добавлены в каталог.
Естественно, роботы не заходят на сайт один раз. Посещения становятся систематическими для того, чтобы в случае изменений на сайте робот смог сохранить копию новой странице и заменить старую версию в каталоге.
Поделиться: