Safetensors, формат сериализации весов нейросетей, перешёл под управление PyTorch Foundation и Linux Foundation. Об этом сообщил Hugging Face, который создал проект и до сих пор оставался его единственным владельцем. Торговая марка, репозиторий и процедуры управления теперь закреплены за Linux Foundation — той же организацией, под чьей эгидой существуют Linux, Kubernetes и ряд других ключевых проектов открытого кода.

Проект появился из конкретной проблемы безопасности. Доминировавшие в экосистеме форматы на основе pickle — стандартного механизма сериализации Python — позволяли при загрузке модели выполнять произвольный код. Пока машинное обучение оставалось нишевой областью, этот риск считался приемлемым. Когда открытый обмен моделями стал нормой, ситуация изменилась: загрузка чужого checkpoint превратилась в потенциальный вектор атаки. Safetensors решил проблему радикально простым способом: JSON-заголовок с жёстким ограничением в 100 МБ описывает метаданные тензоров, за ним следуют сырые данные. Никакого исполнения кода при загрузке, zero-copy маппинг с диска и ленивая загрузка — можно читать отдельные веса, не десериализуя весь checkpoint целиком.

Сегодня Safetensors — формат по умолчанию для распространения моделей на Hugging Face Hub. Его используют десятки тысяч моделей всех модальностей: текст, изображения, аудио, мультимодальные системы. Фактически он стал стандартом де-факто для open-source ML-сообщества, хотя изначально авторы не рассчитывали на такой масштаб принятия.

Формат создан как безопасная альтернатива pickle: JSON-заголовок до 100 МБ и сырые данные тензоров без исполнения кода.

Передача управления в PyTorch Foundation означает, что проект получает нейтральный дом — ни одна компания больше не контролирует его единолично. Два основных мейнтейнера Hugging Face, Люк и Даниэль, остаются в техническом руководящем комитете и продолжают вести проект в ежедневном режиме. Для сторонних организаций, строящих инфраструктуру поверх Safetensors, нейтральное управление снижает риск зависимости от решений одного вендора. Путь к статусу мейнтейнера теперь формально описан в файлах GOVERNANCE.md и MAINTAINERS.md в репозитории.

Для конечных пользователей и разработчиков, уже работающих с форматом, ничего не меняется: API, интеграция с Hub и сам формат остаются прежними без breaking changes. Модели, сохранённые сегодня, будут работать так же и после смены управления.

Технический roadmap при этом амбициозен. Команда работает над интеграцией Safetensors в ядро PyTorch в качестве системы сериализации для torch-моделей. В ближайшие месяцы запланированы device-aware загрузка и сохранение — тензоры смогут загружаться напрямую на CUDA, ROCm и другие ускорители, минуя промежуточное копирование через CPU. Отдельно разрабатываются API для Tensor Parallel и Pipeline Parallel загрузки: каждый ранг или этап пайплайна будет загружать только нужные ему веса. Параллельно формализуется поддержка квантованных форматов — FP8, блочных схем GPTQ и AWQ, а также целочисленных типов с разрядностью ниже байта. Эти задачи затрагивают всю экосистему, и работа над ними внутри PyTorch Foundation позволяет координироваться с другими проектами фонда — DeepSpeed, Ray и vLLM — вместо того чтобы решать одни и те же проблемы параллельно и независимо.