Назад

Все о работе Яндекса

Новые идеи для сео-продвижения часто приходят, когда специалисты детально изучают обновленные алгоритмы. Давайте начнем с азов и посмотрим, как сейчас работает сам Яндекс. Это поможет не только составить стратегию продвижения, но и не допустить ошибок при обновлении сайта.

Сбор поисковой базы

У Яндекс огромная поисковая база по всему миру. На 2017 год она составляет несколько триллионов ссылок. Каждый день поисковые роботы обрабатывают около 2 млрд. урлов для формирования актуальной поисковой выдачи. Поисковый робот смотрит на содержимое страницы, делает его копию, а затем отправляет на сервер и хранит данные там.

Так как количество страниц в Интернете постоянно растет, то робот поисковой системы не прекращает их переобход.

Индексация

Когда страница опознана поисковым роботом, происходит индексация контента. Индексация - это процесс добавления основной информации о странице в базу Яндекс. К основным данным относится:

  • Язык
  • Список ссылок на внутренние страницы
  • Содержание мета-тегов
  • Информация о поведенческих факторах

Последняя собирается с помощью логов Яндекса. Они определяют, как пользователь ведет в себя результатах поиска и на самой странице: на что кликает, а на что не кликает. Кстати, логи Яндекса используются не только на этапе индексации. Они применяются поисковиком и при ранжировании результатов поиска. Из всех собранных данных затем формируется индекс сайта.

Поисковая база

Сформированные на прошлом этапе индексы добавляются в поисковую базу. Через программную платформу мапредьюс все индексы конвертируются в файлы и хранятся в системе. На данный момент Яндекс хранит файлы общим объемом 50 петабайт.

Раз в неделю вся база обновляется. Именно в этот момент поисковый робот яндекс принимает решение добавить полученный контент в результаты поиска.

Более того, специалист по поисковому продвижению Игорь Ашманов уверяет, что полнота поисковой базы Яндекса в разы лучше западного конкурента Googlе.

Как работает выдача

  • Поисковый запрос проходит через Балансеры (агрегаторы выдачи)
  • Запрос проходит по трем отдельным поискам (текст, картинки и видео)
  • Запрос проходит через три уровня метапоиска (там определяется релевантность страниц, а все результаты упорядочиваются)

Результаты выдачи

На первых местах оказываются самые релевантные результаты поиска. Релевантные - значит, наиболее соответствующие запросу по своей тематике, информативности и объему. Кроме того, в расчет берется индекс (статус) сайта.

В последнее время Яндекс значительно улучшил определение релевантности за счет машинного обучения Матрикснет. Система группирует несколько факторов, анализирует поведение пользователей, устанавливает коэффициенты, с помощью которых сайт повышается или падает в выдаче.