OlmoEarth v1.1: спутниковый ИИ стал втрое дешевле без потери точности

Подготовлено редакцией Malakhov AI

Hugging Face Blog·19 мая·3 минИсследованияКод

Allen ИИ выпустила OlmoEarth v1.1 — обновлённое семейство моделей для анализа спутниковых снимков, которое снижает вычислительные затраты до трёх раз при сопоставимом качестве с версией v1. Ключевое изменение — новый способ токенизации данных Sentinel-2, сокращающий длину последовательностей без деградации точности.

Кратко

—OlmoEarth v1.1 сокращает вычислительные затраты до 3× по сравнению с v1 при схожем качестве на benchmark-задачах.
—Эффективность достигнута за счёт объединения токенов трёх пространственных разрешений Sentinel-2 в один токен вместо трёх.
—Наивное слияние токенов давало падение точности на 10 п.п. на m-eurosat kNN — потребовалась модификация режима предобучения.
—Модели v1.1 обучены на том же датасете, что и v1, что позволяет изолировать эффект методологических изменений для научного анализа.
—Семейство включает модели Base, Tiny и Nano; веса и код обучения опубликованы в открытом доступе.

Глоссарий · 7 терминов▾

Токен: Минимальная единица данных, которую модель получает на вход; в случае спутниковых снимков — числовое представление фрагмента изображения с определёнными пространственными и спектральными характеристиками.
MACs (multiply-accumulate operations): Метрика, оценивающая количество базовых арифметических операций при одном проходе модели; используется как прокси для вычислительной стоимости инференса.
Sentinel-2: Серия европейских спутников дистанционного зондирования, предоставляющих мультиспектральные снимки с разрешением от 10 до 60 метров на пиксель.
Трансформерная архитектура: Класс нейросетевых моделей, обрабатывающих данные как последовательности токенов с механизмом внимания; вычислительная сложность растёт квадратично с длиной последовательности.
kNN (k-nearest neighbors): Метод классификации, при котором объект относят к классу, преобладающему среди k ближайших соседей в пространстве признаков; используется как простой benchmark для оценки качества представлений модели.
Предобучение (pretraining): Этап обучения модели на большом общем датасете до её дообучения под конкретную задачу.
Инференс: Процесс применения уже обученной модели для получения предсказаний на новых данных.

С ноября 2025 года, когда вышла первая версия OlmoEarth, партнёры Allen ИИ применяли модель для мониторинга мангровых зарослей, классификации причин вырубки лесов и построения карт сельскохозяйственных культур в масштабе целых стран — задач, требующих обработки десятков и сотен тысяч квадратных километров снимков. При таких объёмах вычислительные расходы становятся главным ограничением: они доминируют над стоимостью экспорта данных, препроцессинга и постобработки вместе взятых.

OlmoEarth v1.1 решает эту проблему через переосмысление базовой единицы обработки — токена. Модели семейства OlmoEarth основаны на трансформерной архитектуре, где вычислительная сложность растёт квадратично с длиной входной последовательности. Это означает, что даже умеренное сокращение числа токенов даёт непропорционально большой выигрыш в скорости и стоимости инференса. Метрика MACs (multiply-accumulate operations), оценивающая объём вычислений на один проход модели, у v1.1 существенно ниже, чем у v1 при аналогичных размерах.

Модель	Токенов на патч (2 временных среза)	Относительная стоимость вычислений
OlmoEarth v1	6 (2 среза × 3 разрешения)	1×
OlmoEarth v1.1	2 (2 среза × 1 объединённый токен)	до 0.33× (до 3× дешевле)

Спутниковые снимки Sentinel-2 — один из основных типов входных данных для OlmoEarth — содержат 12 каналов с тремя пространственными разрешениями: 10 м, 20 м и 60 м. В версии v1 каждое разрешение порождало отдельный токен на каждый временной срез и каждый пространственный патч. Для снимка с двумя временными метками это давало шесть токенов на патч. Такой подход используют и конкурирующие модели — Galileo и SatMAE, причём SatMAE демонстрирует заметно лучшие результаты именно благодаря раздельной токенизации разрешений. Однако модель CROMA показывает, что объединение всех каналов в один токен тоже работоспособно.

Эффективность достигнута за счёт объединения токенов трёх пространственных разрешений Sentinel-2 в один токен вместо трёх.

OlmoEarth v11 blog and social copy - Google Docs-image-1 · Источник: Hugging Face Blog

В v1.1 команда Allen ИИ объединила три разрешения в единый токен, сократив их количество втрое. Прямолинейное слияние привело к падению точности на 10 процентных пунктов на benchmark m-eurosat kNN — одном из стандартных тестов для моделей дистанционного зондирования. Исследователи объясняют это тем, что разделение каналов по разным токенам облегчает модели моделирование межканальных зависимостей. Чтобы сохранить эти зависимости при объединении токенов, потребовалась модификация режима предобучения, подробности которой описаны в техническом отчёте.

Для исследовательского сообщества v1.1 представляет дополнительную ценность: обе версии обучены на одном и том же датасете, поэтому любые различия в поведении моделей можно однозначно отнести к методологическим изменениям, а не к составу обучающих данных. Это редкое условие для сравнительного анализа в области предобучения моделей дистанционного зондирования.

Практический результат: при сопоставимом качестве на смеси research benchmark-задач и прикладных задач партнёров v1.1 позволяет обновлять планетарные карты чаще и дешевле. Семейство включает модели трёх размеров — Base, Tiny и Nano, — веса и код предобучения опубликованы на Hugging Face и GitHub. Авторы оговариваются, что в отдельных задачах наблюдаются регрессии по сравнению с v1, и рекомендуют проверять результаты на конкретном применении перед переходом на новую версию.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Google DeepMind выпустила Nano Banana 2 Lite и Gemini Omni Flash для разработчиков

Продолжить по разделам

OlmoEarth v1.1: спутниковый ИИ стал втрое дешевле без потери точности

Кратко

Читать дальше

Anthropic вернула Fable 5 после двухнедельного бана из-за jailbreak

Google DeepMind представила Nano Banana 2 Lite

Google DeepMind выпустила Nano Banana 2 Lite и Gemini Omni Flash для разработчиков