По данным Google, 15% запросов пользователей поисковой системы – это запросы, которых никогда раньше не было. Люди пытаются формулировать фразы так, чтобы поисковая система поняла их, но это получается не всегда.
В свою очередь, поисковые системы совершенствуют алгоритмы для лучшего понимания разговорного, человеческого языка.
BERT от Google – это система понимания естественных формулировок пользователя на базе обучаемой нейронной сети. Алгоритм создан для лучшего понимания длинных диалоговых низкочастотных запросов. Он учитывает не слова по порядку, а смысл предложения целиком, с предлогами, в том числе «без», что позволяет выдавать более полезные ответы.
Тренировка и тестирование алгоритма на английском языке были начаты около года назад, и на данный момент он помогает лучше понять около 10% поисковых запросов. Специалисты Google отмечают, что BERT может извлекать уроки из одного языка, и применять их к другим. Сейчас алгоритм применяется к составлению избранных сниппетов, и показывает свою эффективность в корейском, португальском и хинди языках.
Чем грозит введение BERT в российском сегменте?
Алгоритм позволяет не только учитывать предыдущие и последующие слова внутри фразы, но и способен оценивать согласованность предложений в тексте. Сайты, содержащие полезный, структурированный, тематический контент, отвечающий на вопрос пользователя окажутся в выдаче выше, несмотря на меньшее количество ключевых слов.
Лучшее понимание человека поисковой системой рано или поздно позволит не формулировать текст запросов «специально для робота», и тем, кто привык это делать, возможно будет сложно перестроиться.