Как работают поисковые системы

Как работают поисковые системыКак работают поисковые системы

У поисковых систем есть две основные функции:

1. сбор данных и построение индекса;

2. предоставление ответов исходя из релевантности запроса и результата сбора данных.

Индексация страниц

Представьте себе интернет в виде остановок системы метро большого города. Каждая станция метро – это документ, а пути – ссылки, которые их связывают. Поисковым системам нужен способ, чтобы обойти весь город и найти все остановки по пути, поэтому они используют лучший вариант, который у них есть в наличии – ссылки между страницами.

Проходя по ссылкам, специальные поисковые роботы (они называются «сканеры» или «пауки») собирают миллиарды связанных между собой документов. После того, как сканнеры нашли все эти страницы, их код декодируется, разбивается на куски текста и храниться на жёстких дисках для быстрого доступа в будущем (при поисковом запросе пользователя).

Для того, чтобы выдавать ответы пользователям максимально быстро, поисковые системы строят огромные ЦОД (Центры Обработки Данных) на разных континентах. Каждый ЦОД – это громадные хранилища и тысячи компьютеров для обработки невероятного количества информации. Когда какой-то пользователь вводит поисковый запрос в поле ввода, эти компьютеры за несколько мгновений перебирают огромное количество информации, чтобы выдать пользователю результат. Задержка даже в 1-2 секунды может вызвать недовольство, поэтому поисковые системы постоянно совершенствуются, чтобы выдавать ответ максимально быстро.

Предоставление результатов

Так как же поисковые системы догадываются, что пользователю ответить? В процессе поиска ответа на поисковой запрос, поисковые системы просматривают миллиарды документов и выполняют две вещи:

  • Выбирают результаты, которые релевантны или полезны для запроса.
  • Выбранные результаты оцениваются и сортируются по важности.

В поисковых системах релевантность означает больше, чем просто нахождение страницы с правильными словами. В первые годы развития интернета, поисковые системы не сильно усложняли свою работу и просто искали текст в теле документа. Ответы пользователям, естественно, были соответствующие.

В процессе эволюции, программисты и инженеры разработали гораздо лучшие способы искать ценные результаты, которые удовлетворят даже самого искушенного пользователя. На сегодня, на релевантность влияют более 100 факторов, многие из них мы рассмотрим чуть позже.

Как поисковые системы определяют важность?

В настоящее время передовые поисковые системы, как правило, интерпретируют важность как популярность – чем более популярный сайт или страница, тем более ценная информация там должна быть. Это предположение оказалось довольно успешным на практике, в то время как поисковые системы продолжили улучшение своих результатов при помощи метрик, которые интерпретируют популярность.

Популярность сайта определяются не вручную. Вместо этого поисковые системы решают сложные математические уравнения, чтобы отделять полезные результаты от «шелухи». Эти уравнения часто состоят из сотен переменных. В SEO они именуются как «Факторы Ранжирования».

Комментарии

20.08.2014 06:07:57
Avatar of 202202
Большое спасибо за статью. Очень интересно.
20.08.2014 07:47:22
Avatar of КонсервКонсерв
@202
Всегда пожалуйста. Будет продолжение.
20.08.2014 10:22:33
Avatar of 202202
@консерв
Большое спасибо!
22.08.2014 09:41:44
Avatar of АнонимАноним
Спасибо. Очень интересно.
28.08.2014 07:37:14
Avatar of Юра ГалинЮра Галин
Хорошая статья!
29.08.2014 12:29:38
Avatar of КонсервКонсерв
Спасибо, будут ещё :-)
Captcha Обновить
Go Top