Принято считать, что если сайт стоит в топе поисковой выдачи, нейросеть с большой вероятностью сошлётся на него в ответе. Исследование команды RankCaster ИИ — платформы для управления видимостью брендов в ответах ИИ-систем — показывает обратное. Авторы запустили четыре англоязычных B2B-запроса по десять раз в каждой из трёх систем, параллельно собрав топ-10 Google и Bing по тем же запросам. Из 120 позиций SEO-выдачи с источниками нейросетей совпало лишь 4 URL — 3,3%. Все четыре совпадения пришлись на Bing; у Google — ноль. У ChatGPT не совпало ни одного URL ни с одним поисковиком.

Чтобы корректно считать совпадения, исследователи сначала разобрали, что именно каждая система называет «источником» на уровне сетевого обмена. Для этого они анализировали трафик веб-клиентов через инструменты разработчика браузера.

Пара поисковик × нейросетьСовпадений по URL
Google × ChatGPT0
Google × Gemini0
Google × DeepSeek0
Bing × ChatGPT0
Bing × Gemini1
Bing × DeepSeek1
Итого4 из 120 (3,3%)

ChatGPT отправляет POST-запросы на /conversation и получает ответ потоком через Server-Sent Events. Источники хранятся в массиве annotations[] в объектах url_citation. Каждый объект содержит поля url, title и два числовых смещения — start_ix и end_ix. Это границы конкретного фрагмента сгенерированного текста, к которому привязана ссылка, причём смещения считаются в единицах UTF-16 — как в JavaScript. Практическое следствие: эмодзи и часть CJK-символов занимают две единицы (суррогатная пара), и если считать байтами, цитаты сместятся. Работа без аккаунта не даёт анонимности: каждый запрос сопровождается идентификатором устройства и токенами Cloudflare/Sentinel, которые привязывают обмен к конкретному клиенту. Перед основным запросом клиент получает так называемый conduit_token — доказательство работы клиента, без которого сервер запрос не примет. В части сессий та же процедура дополнительно требовала токен Cloudflare Turnstile, то есть антибот-проверка совмещена с получением токена в одном шаге.

ChatGPT привязывает каждую цитату к конкретному фрагменту текста через поля start_ix / end_ix с UTF-16-смещениями.

Gemini работает через внутренний JavaScript-каркас Google под названием Wiz — тот же, на котором собраны Google Docs, Maps и Photos. Запросы уходят на эндпоинт batchexecute в формате application/x-www-form-urlencoded. Полезная нагрузка упакована в формат JSPB/PBLite: это Protobuf-сообщение, записанное как JSON-массив, где поля определяются не именами, а позицией в массиве. Имён полей в сетевом обмене нет вообще. Открытых.proto-описаний для этого эндпоинта не существует, поэтому смысл каждой позиции авторы восстанавливали эмпирически. Среди предположительно расшифрованных полей — sourceUrl (URL источника), Mf (заголовок), SR (краткое содержание), rs (внутренняя оценка доверия к домену), ls (дата последнего обращения), GK (диапазон символов в ответе — аналог start_ix/end_ix из ChatGPT) и tM (тип слияния, в обмене встречается значение MERGED). Авторы подчёркивают: присутствие полей в потоке — наблюдаемый факт, а их смысловая расшифровка — гипотеза.

Стабильность цитирования авторы измеряли показателем APR (Answer Presence Rate) — в скольких из десяти прогонов источник попал в ответ. В таблицы включались источники с APR не ниже 20%. На концептуальном запросе «What is GEO?» ChatGPT во всех десяти прогонах цитировал статью arXiv 2311.09735 (авторы — исследователи Принстона и Колумбии, именно в ней введён термин GEO — Generative Engine Optimization). APR 100% — выше, чем у любого маркетингового блога в выборке. Также стабильно появлялись Wikipedia и узкоспециализированные блоги.

Исследование затрагивает более широкую проблему, которую в отрасли начали называть GEO — оптимизацией контента под генеративные поисковые системы в противовес классическому SEO. Если нейросети формируют источники независимо от поисковой выдачи, стратегии продвижения, заточенные под Google, не переносятся на ИИ-ответы напрямую. Авторы оговариваются: выборка небольшая (4 запроса, 10 прогонов, один день замеров), доверительный интервал для каждой точки — порядка ±15–20 процентных пунктов, поэтому выводы носят качественный, а не статистически строгий характер.