- ua
- ru
Буквально несколько дней назад Яндекс запустил новую версию поиска, назвав её в честь советского конструктора ракетно-космической техники. Видимо, гугловские птице-звери не дают Платону Щукину спать спокойно, и в российском уголке интернета решили придумать свою фичу, спаянную с другим трендом – нейронной сетью.
Поисковый алгоритм «Королёв» хотя и ничего не поясняет своим названием, но подсознательно отсылает к научности, в отличие от зоопарка Google с его пандами, пингвинами и колибри. Суть же нового алгоритма сводится к тому, что с помощью нейронной сети он сопоставляет смысл запросов с содержанием веб-страниц, что позволяет Яндексу выдавать пользователям более релевантные ответы. Пока что алгоритм лишь учится, собирается статистика, а юзеры страдают от несовершенства Королёва, получая в выдаче дикую смесь из рекламы и дорвеев, в результате чего они вынуждены использовать более однозначные запросы. В общем, ни о каком искусственном интеллекте речи не идет, поиск стал лишь хуже.
Как бы там ни было, по заверению разработчиков, алгоритм Королёв способен обучаться, и, вполне возможно, однажды он проявит себя не хуже знаменитого основоположника практической космонавтики. Но пока что доступны только малые высоты…
Сначала Яндекс умел ранжировать сайты только по плотности ключа, и чем чаще на странице попадались ключи из запроса, тем больше он подходил. Немногим позже поисковые системы стали учитывать внешние ссылки на страницы, научились опознавать регион, откуда пришел запрос, а затем начали обращать внимание и на поведение пользователей. Это, последнее улучшение, и положило начало алгоритму «Королёв».
На данный момент Яндекс опирается на слова, а не на смыслы. Механизм же выдачи примерно такой: сначала робот определяет «предварительно подходящие» веб-страницы, вмещающие слова из поискового запроса. При этом значение слов не учитывается – только факт вхождения. Затем запускается многосоставная формула ранжирования, распределяя сайты по топ-10, 20, 30…
Необходимость изменений в алгоритмах поисковой системы зрела давно: один и тот же смысл можно сформулировать разными словами. И даже если на страничке нет ни одного слова из поискового запроса, это не значит, что она не поясняет смысл «вопроса», заданного юзером.
К примеру, пользователь вбил «купить машину». Но на сайте такого ключа нет – ни составного ключа, ни по отдельности «купить» и «машина». А всё дело в том, что копирайтер использовал другие слова: вместо «купить» – «приобрести», а вместо «машина» – автомобиль. В результате, какой бы интересной и качественной не была статья, пользователь ее не увидит.
Обновленный поиск работает не столько со словами, сколько со смыслами, сопоставляя семантические векторы запросов юзеров и веб-страниц, причем анализируется вся страничка целиком – и ее заголовок, и сам текст. Кстати, начало «Королёву» было положено ещё в 2016 году, когда Яндекс запустил свой новый поисковый алгоритм – «Палех».
Главный секрет алгоритма «Королёв» заключается в том, что вычислительные операции теперь занимают гораздо больше времени, а потому анализ семантики страницы происходит не после того, как пользователь вбил запрос, а до – еще во время индексации веб-документа. Говоря проще, странице присваивается определенный идентификационный код. Он же присваивается и поисковому запросу, и при совпадении таких кодов статья попадает на страницу выдачи.
Умение понимать смысл предельно важно. Особенно когда пользователь ищет что-то при помощи синонимов или забыл термин и пытается описать что-то своими словами. Удастся ли академику «Королёву» разобраться в семантике так, как он разобрался в ракетостроении, покажет лишь практика. Пока же нейронная сеть похожа на дырявый невод, забрасывать который приходится по десятку раз.
© Студия копирайтинга «Ямбус»