Когда ИИ-агент пытается написать SQL-запрос к конкретному датасету, ему нужно знать схему таблиц, бизнес-логику метрик, соглашения команды и историю изменений. Всё это обычно разбросано по метадата-каталогам, корпоративным вики, комментариям в коде и головах конкретных инженеров. Каждый разработчик агентов решал эту проблему по-своему: Obsidian Vault, подключённый к coding-агенту, файлы AGENTS.md и CLAUDE.md, репозитории «metadata as code» на data-командах. Паттерн один, но реализации несовместимы, и знания остаются заперты внутри породившей их системы.
OKF v0.1 предлагает единую точку сборки. Спецификация намеренно минималистична: директория Markdown-файлов, YAML-заголовок с одним обязательным полем «type» и набором опциональных — title, description, resource, tags, временны́е метки. Тело документа — произвольный Markdown. Концепции ссылаются друг на друга через стандартные Markdown-ссылки, формируя граф знаний. Такой бандл открывается в любом текстовом редакторе, рендерится на GitHub и индексируется любым поисковым инструментом без дополнительной обработки.
| Поле OKF | Обязательное | Описание |
|---|---|---|
| type | Да | Тип документа; единственное обязательное поле |
| title | Нет | Заголовок документа |
| description | Нет | Краткое описание |
| resource | Нет | Ссылка на связанный ресурс |
| tags | Нет | Теги для классификации |
| timestamps | Нет | Временны́е метки создания и обновления |
Архитектурно формат разделяет производителей и потребителей знаний. Бандл, написанный человеком, может потреблять ИИ-агент. Бандл, сгенерированный машиной, можно просмотреть в визуализаторе. Какие типы документов существуют, какие дополнительные поля они содержат и как структурировано тело — решает производитель. Это сознательный выбор: жёсткая схема убила бы переносимость.
Концепции связываются через стандартные Markdown-ссылки, образуя граф знаний, читаемый в любом редакторе и индексируемый любым поисковым инструментом.
Вместе со спецификацией Google Cloud выпустил несколько референсных реализаций. Агент обогащения обходит датасеты BigQuery и создаёт OKF-документ для каждой таблицы. Статический HTML-визуализатор позволяет просматривать бандл без специального ПО. Три готовых примера бандлов — для GA4 e-commerce, Stack Overflow и Bitcoin — дают отправную точку для команд, которые хотят попробовать формат на реальных данных. Knowledge Catalog Google Cloud обновлён: он умеет принимать OKF на вход и отдавать его агентам.
Идея «LLM wiki» — структурированного хранилища знаний специально для языковых моделей — была популяризирована Андреем Карпати и быстро стала неформальным стандартом среди разработчиков агентов. OKF по сути формализует этот паттерн и делает его интероперабельным. Принципиальное отличие от существующих решений — отсутствие привязки к конкретному облаку, базе данных или фреймворку агентов.
Ограничения формата пока очевидны: v0.1 — ранняя спецификация, экосистема инструментов только формируется, а реальная совместимость между разными командами и вендорами будет зависеть от того, насколько широко формат примут за пределами Google Cloud. Тем не менее открытая публикация на GitHub и намеренная минималистичность спецификации снижают порог входа и оставляют пространство для расширений без поломки совместимости.



