Файл llms.txt появился как попытка дать ИИ-системам структурированную точку входа на сайт — аналог sitemap.xml, но ориентированный не на поисковые краулеры, а на языковые модели. Идея простая: вместо того чтобы агент разбирал HTML-страницы вручную, он открывает один файл в корне домена и получает карту контента в читаемом для модели формате.

Вокруг файла сложились два непримиримых лагеря. Первый продаёт его как обязательный инструмент GEO (generative engine optimization) и ссылается на прирост цитируемости в 30–60%. Второй приводит логи: аудит CDN на тысяче доменов Adobe Experience Manager за месяц показал, что специализированные LLM-боты к /llms.txt практически не обращаются. OtterlyAI за 90 дней насчитала 84 обращения к файлу из 62 100 визитов ИИ-краулеров — 0,1%. Джон Мюллер из Google публично сравнил llms.txt с мета-тегом keywords, то есть с реликтом без практического эффекта. Google официально отказался поддерживать стандарт; формального статуса IETF у файла нет.

Исследование / источникОхватРезультат
OtterlyAI, 90 дней62 100 визитов AI-ботов84 обращения к llms.txt (0,1%)
Аудит CDN Adobe Experience Manager1 000 доменов, 30 днейПочти нулевые обращения LLM-ботов к /llms.txt
SE Ranking300 000 доменовllms.txt у 10,13% сайтов; корреляции с цитируемостью не найдено
Princeton GEOне указан+30–40% цитируемости от добавления статистики и прямых цитат в текст
Digital Bloomне указан+37% цитируемости от использования pull-quote'ов

Проблема спора в том, что обе стороны измеряют один и тот же механизм — фоновый краулинг — и делают из него универсальный вывод. Между тем доступ ИИ к сайту устроен принципиально по-разному в зависимости от контекста. Фоновые краулеры (GPTBot, ClaudeBot, PerplexityBot) обходят HTML напрямую и строят индекс впрок: им навигационная подсказка не нужна, они и так идут по ссылкам. Обучающие данные — отдельный слой: модель отвечает из того, что выучила до даты среза, никакого чтения в реальном времени там нет. Третий слой — агентный браузинг: пользователь ставит задачу, и система прямо сейчас делает HTTP-запросы к нужным URL. Вот здесь llms.txt имеет смысл как точка входа для агента, которому нужно быстро понять структуру незнакомого сайта.

SE Ranking проверила 300 000 доменов: llms.txt есть у 10,13% сайтов, но связи с частотой цитирования в ИИ-ответах не обнаружено.

Автор материала в мае 2026 прогнал восемь ИИ-систем с веб-доступом через пять сценариев, чтобы проверить агентный слой напрямую. Тест не претендует на статистическую репрезентативность — это воспроизводимый срез поведения на конкретную дату. Результат: по прямому запросу «прочитай /llms.txt» файл открыли только ChatGPT 5.5 и Grok 4. Ни одна из восьми систем не обратилась к файлу самостоятельно, без явного указания. Anthropic, по стороннему отчёту Presenc ИИ, учитывает файл в retrieval-процессе; OpenAI официальной позиции не озвучивал.

Цифра «+30–60% цитируемости», которую активно тиражирует хайп-лагерь, не имеет отношения к llms.txt. Первоисточники — исследование Princeton GEO, намерившее +30–40% от добавления статистики и прямых цитат в текст, отчёт Digital Bloom с +37% от pull-quote'ов и данные по адверториалам на авторитетных площадках (+35–60%). Все эти тактики касаются содержания страниц, а не файла в корне домена. SE Ranking, проверив 300 000 доменов, не нашла корреляции между наличием llms.txt и частотой попадания в ИИ-ответы.

Практический вывод из всего массива данных выглядит так: для маркетингового лендинга файл почти не даёт эффекта — фоновые краулеры его игнорируют, а прямой связи с цитируемостью нет. Для SaaS-продуктов, документационных сайтов и API-сервисов картина другая. Coding-агенты — Cursor, Claude Code, GitHub Copilot — уже сейчас используют /llms.txt и /llms-full.txt как навигационный слой вместо разбора HTML. Это узкая, но реальная ниша: разработчик, работающий с незнакомой библиотекой через IDE-агент, получает структурированный контекст быстрее, чем если бы агент парсил документацию постранично. Сделать файл можно за 30 минут; ждать от него магии в поисковой выдаче не стоит.