Теперь поиск обновляет знания об интересах пользователя не раз в сутки, а в режиме реального времени. Это позволяет учитывать его сиюминутные интересы и отдавать те результаты поиска, которые релевантны предыдущим запросам текущей сессии.
За этим текстом стоит гораздо большее, чем представляется после первого прочтения. Чтобы понять, в чем суть нового алгоритма Яндекса «Дублин», обратимся к базовым основам поиска.
Всем известно, что качество поиска наполовину зависит от качества определения поисковой цели. К примеру, если вы у метро спросите прохожего, как пройти в Большой театр, то его взмах рукой в неопределенное пространство и короткое «вроде бы где-то там» вряд ли вам облегчат поиск. При этом вам дали понять, что и эта информация не точна. Конкретный вектор поиска и вводные (ориентиры) дадут гораздо больше пользы. Примерно также работает и поисковая машина. Прежде, чем ответить на ваш запрос, она пытается понять ваши потребности и создает вводные (ориентиры для поиска). Запросы, вводившиеся в поиск другими людьми и вами, как раз и является такими ориентирами. До Дублина персональный поиск использовал обобщенную информацию за целые сутки, и за эти сутки вы многое искали, причем в разных областях, совершенно не связанных между собой. Но теперь появилась возможность обрабатывать данные в реальном времени.
Это означает, что Яндекс теперь собирает статистику запросов, непосредственно предшествующих вводу запроса. К примеру, вы искали фильм с Анжелиной Джоли, потом передумали и начали искать порнофильм, а потом вам захотелось зайти на сайт знакомств. Логика понятна, и для разных людей стереотипное поведение разное, но обратите внимание: поиск обычного фильма и поиск сайта знакомств совершенно не связан. Определив ваш тип криптой (в которой, кстати, гораздо больше классов, чем показано по ссылке (там не показана персональная часть), Яндекс получает возможность сгенерить подсказки совсем иного качественного уровня. Яндекс хранит и обрабатывает историю серфинга за длительное время, делает анализ ваших интересов по почтовым перепискам (разбирая их смысл), анализирует типы файлов в Яндекс.Диске и характер обмена ими с другими через Яндекс.Диск), составляя подробное досье на каждого своего юзера… Это и позволяет в режиме реального времени «подсунуть» в поисковую подсказку для вас по запросу «фильмы с Анжелиной Джоли» сразу сайт знакомств, минуя промежуточное звено с порно. Грубо говоря, Яндекс УГАДАЕТ, что вы желаете, на основании вашей истории запросов и стереотипа поведения по классификатору. Но это только одна сторона медали, есть и другая.
Поисковые цели стали определяться более четко, более детально. Поскольку определение поисковой цели – это половина алгоритма поиска по своей функциональной важности, то естественно, что малейшие изменения весов в определении ориентиров поиска дадут значительные колебания в выдаче. Это мы сегодня и наблюдаем. Методом последовательного приближения (в народе «качели») Яндекс избавляется от крупных «недосмотров», и в течение нескольких апов стабилизируется.
На ссылочное ранжирование изменения тоже повлияли. Поэтому те, кто в прошедший АП от 4-го июня получил непонятную разнородную картинку с высокой амплитудой по позициям (при этом не проводил работы по сайту), скорее всего, стали «жертвами» нового алгоритма Яндекса. Они столкнулись не с внезапным переспамом (хотя внешне это выглядит именно так), а с багами в настройках ссылочного и текстового ранжирования при внедрении Дублина, что косвенно повлияло на фильтры разного уровня.