Новые идеи для сео-продвижения часто приходят, когда специалисты детально изучают обновленные алгоритмы. Давайте начнем с азов и посмотрим, как сейчас работает сам Яндекс. Это поможет не только составить стратегию продвижения, но и не допустить ошибок при обновлении сайта.
Сбор поисковой базы
У Яндекс огромная поисковая база по всему миру. На 2017 год она составляет несколько триллионов ссылок. Каждый день поисковые роботы обрабатывают около 2 млрд. урлов для формирования актуальной поисковой выдачи. Поисковый робот смотрит на содержимое страницы, делает его копию, а затем отправляет на сервер и хранит данные там.
Так как количество страниц в Интернете постоянно растет, то робот поисковой системы не прекращает их переобход.
Индексация
Когда страница опознана поисковым роботом, происходит индексация контента. Индексация - это процесс добавления основной информации о странице в базу Яндекс. К основным данным относится:
- Язык
- Список ссылок на внутренние страницы
- Содержание мета-тегов
- Информация о поведенческих факторах
Последняя собирается с помощью логов Яндекса. Они определяют, как пользователь ведет в себя результатах поиска и на самой странице: на что кликает, а на что не кликает. Кстати, логи Яндекса используются не только на этапе индексации. Они применяются поисковиком и при ранжировании результатов поиска. Из всех собранных данных затем формируется индекс сайта.
Тест услуг 10 ссылок за 2990₽
Хорошее предложение для тех, кто хочет убедиться в качестве и эффективности наших услуг
ЗаказатьПоисковая база
Сформированные на прошлом этапе индексы добавляются в поисковую базу. Через программную платформу мапредьюс все индексы конвертируются в файлы и хранятся в системе. На данный момент Яндекс хранит файлы общим объемом 50 петабайт.
Раз в неделю вся база обновляется. Именно в этот момент поисковый робот яндекс принимает решение добавить полученный контент в результаты поиска.
Более того, специалист по поисковому продвижению Игорь Ашманов уверяет, что полнота поисковой базы Яндекса в разы лучше западного конкурента Googlе.
Как работает выдача
- Поисковый запрос проходит через Балансеры (агрегаторы выдачи)
- Запрос проходит по трем отдельным поискам (текст, картинки и видео)
- Запрос проходит через три уровня метапоиска (там определяется релевантность страниц, а все результаты упорядочиваются)
Результаты выдачи
На первых местах оказываются самые релевантные результаты поиска. Релевантные - значит, наиболее соответствующие запросу по своей тематике, информативности и объему. Кроме того, в расчет берется индекс (статус) сайта.
В последнее время Яндекс значительно улучшил определение релевантности за счет машинного обучения Матрикснет. Система группирует несколько факторов, анализирует поведение пользователей, устанавливает коэффициенты, с помощью которых сайт повышается или падает в выдаче.