Королев - особенности нового алгоритма от Яндекс

29 августа 2017 г.
2 мин
2059 просмотра
Особенности алгоритма Яндекса Королев

В конце августа Яндекс провел презентацию нового алгоритма. Он стал первым алгоритмом российского поисковика, который использует по-настоящему мощные нейронные сети для определения семантических настроек документов. На презентации, состоявшейся в Московском планетарии, многие отметили, что Королев во многом напоминает алгоритм Палех. Разве что, у него больше возможностей для анализа из-за развитой НС.

Принцип работы алгоритма Королев

Сначала система анализирует семантические векторы новой страницы и документов на сайте. Затем Яндекс сохраняет эти данные в отдельном индексе. Когда пользователь создает поисковый запрос в системе, он также анализируется яндексом по семантическим векторам. Затем показатели запроса сопоставляются с показателями сайтов и в выдачу попадают те страницы и документы, которые подходят лучшим образом.

Принципиальные отличия от Палеха

Спустя месяц стало очевидно, что в основе нового алгоритма заложена система Палех, представленная около года назад. Однако Королев существенно обходит предшественника по вычислительным мощностям. Например, Палех мог анализировать данные только в заголовках страницы, а само сопоставление данных проходило на последней стадии ранжирования. При этом в индекс попадало около 150-170 документов.

Королев может вычислять семантические векторы уже на стадии индексирования и обрабатывать более 200 000 документов/страниц на один запрос пользователя. Далее все результаты хранятся в поисковом индексе.

Поменялась и сама архитектура нейронной сети. Так, для Палеха использовалась трехуровневая нейронная сеть. На каждом скрытом уровне находилось по 150, 300 и 300 нейронов. Нейронная сеть Королева построена по клиновидной архитектуре. На каждом уровне при этом есть 500, 500 и 40 нейронов. Благодаря этому вычислительные ресурсы стали использоваться намного эффективнее.

Пользовательские сигналы и Королев

В начале 2017 года Яндекс начал с особым трепетом относиться к накрутке поведенческих факторов и после первой волны проверки под санкции попали 300 сайтов. И это неспроста, ведь новый алгоритм считает пользовательские сигналы важным критерием для ранжирования.

Алгоритм будет отслеживать поведение пользователя после перехода на сайт, анализировать время, проведенное на ресурсе, среднее время пребывания на странице. Яндекс берет в учет и другие данные, если на сайте установлена система статистики. Кроме того, Королев берет в учет пользовательские оценки, которые выставляются в системе Яндекс. Толока. Это ресурс, где простые пользователи оценивают качество сайта за небольшое вознаграждение.

Также вам понравится

вебинар_шакина
time icon 1 мин
users icon 45 просмотра
3 октября 2024 г.
Технические аспекты SERM: SEO и SERM в одном флаконе - в гостях у Михаила Шакина
Что такое SERM и зачем это нужно? Как SERM связано с SEO и как ему помогает? Какие есть лайфхаки по использованию этого инструмента?
Читать далее
interiewsklientom2
time icon 3 мин
users icon 42 просмотра
30 сентября 2024 г.
Интервью с клиентами Zenlink. Часть 2
Ещё один клиент отвечает на 6 вопросов о своих проектах. Интервью даёт Alextrainer - руководитель небольшой арбитражной команды.
Читать далее
partner
time icon 2 мин
users icon 85 просмотра
16 сентября 2024 г.
Кейсы наших лучших партнеров
Статистика, рекомендации и руководство как стать успешным партнером Zenlink.
Читать далее
interiewsklientom
time icon 4 мин
users icon 154 просмотра
11 сентября 2024 г.
Интервью с клиентами Zenlink
Мы задали 6 вопросов нашим клиентам: о тематиках проекта, задачах и результатах.
Читать далее
reputationincinema
time icon 7 мин
users icon 65 просмотра
9 сентября 2024 г.
Репутация в кино: 5 фильмов, где этот вопрос стоит на первом плане
В этой статье мы рассмотрим пять фильмов, где имидж стоит во главе угла.
Читать далее
balticdigitaldays
time icon 4 мин
users icon 115 просмотра
27 августа 2024 г.
Как мы сходили на Baltic Digital Days
В этом году мы стали гостями конференции и хотим поделиться впечатлениями.
Читать далее
Вверх