Когда ИИ-агент пытается написать SQL-запрос к конкретному датасету, ему нужно знать схему таблиц, бизнес-логику метрик, соглашения команды и историю изменений. Всё это обычно разбросано по метадата-каталогам, корпоративным вики, комментариям в коде и головах конкретных инженеров. Каждый разработчик агентов решал эту проблему по-своему: Obsidian Vault, подключённый к coding-агенту, файлы AGENTS.md и CLAUDE.md, репозитории «metadata as code» на data-командах. Паттерн один, но реализации несовместимы, и знания остаются заперты внутри породившей их системы.

OKF v0.1 предлагает единую точку сборки. Спецификация намеренно минималистична: директория Markdown-файлов, YAML-заголовок с одним обязательным полем «type» и набором опциональных — title, description, resource, tags, временны́е метки. Тело документа — произвольный Markdown. Концепции ссылаются друг на друга через стандартные Markdown-ссылки, формируя граф знаний. Такой бандл открывается в любом текстовом редакторе, рендерится на GitHub и индексируется любым поисковым инструментом без дополнительной обработки.

Поле OKFОбязательноеОписание
typeДаТип документа; единственное обязательное поле
titleНетЗаголовок документа
descriptionНетКраткое описание
resourceНетСсылка на связанный ресурс
tagsНетТеги для классификации
timestampsНетВременны́е метки создания и обновления

Архитектурно формат разделяет производителей и потребителей знаний. Бандл, написанный человеком, может потреблять ИИ-агент. Бандл, сгенерированный машиной, можно просмотреть в визуализаторе. Какие типы документов существуют, какие дополнительные поля они содержат и как структурировано тело — решает производитель. Это сознательный выбор: жёсткая схема убила бы переносимость.

Концепции связываются через стандартные Markdown-ссылки, образуя граф знаний, читаемый в любом редакторе и индексируемый любым поисковым инструментом.

Вместе со спецификацией Google Cloud выпустил несколько референсных реализаций. Агент обогащения обходит датасеты BigQuery и создаёт OKF-документ для каждой таблицы. Статический HTML-визуализатор позволяет просматривать бандл без специального ПО. Три готовых примера бандлов — для GA4 e-commerce, Stack Overflow и Bitcoin — дают отправную точку для команд, которые хотят попробовать формат на реальных данных. Knowledge Catalog Google Cloud обновлён: он умеет принимать OKF на вход и отдавать его агентам.

Идея «LLM wiki» — структурированного хранилища знаний специально для языковых моделей — была популяризирована Андреем Карпати и быстро стала неформальным стандартом среди разработчиков агентов. OKF по сути формализует этот паттерн и делает его интероперабельным. Принципиальное отличие от существующих решений — отсутствие привязки к конкретному облаку, базе данных или фреймворку агентов.

Ограничения формата пока очевидны: v0.1 — ранняя спецификация, экосистема инструментов только формируется, а реальная совместимость между разными командами и вендорами будет зависеть от того, насколько широко формат примут за пределами Google Cloud. Тем не менее открытая публикация на GitHub и намеренная минималистичность спецификации снижают порог входа и оставляют пространство для расширений без поломки совместимости.