Сергей Брин направил инженерам DeepMind внутренний меморандум, в котором потребовал сделать Gemini «основным разработчиком» кода. «Чтобы выиграть финальный спринт, мы должны срочно закрыть разрыв в агентном исполнении», — написал он. Одновременно CTO DeepMind Корай Кавукчуоглу включился в работу новой специализированной группы, которую возглавил Себастьян Боргео — инженер, прежде отвечавший за предобучение моделей компании.

Команда сосредоточена на сложных задачах с длинным горизонтом планирования: написание программ с нуля, чтение файлов, интерпретация намерений пользователя. Именно такие сценарии отличают профессиональную разработку от простой генерации фрагментов кода. По данным The Information, внутри Google сложился консенсус: инструменты Anthropic — прежде всего Claude с его возможностями для программирования — справляются с подобными задачами лучше, чем текущие версии Gemini.

Антропик действительно занял сильную позицию в этом сегменте. Модели Claude 3.5 Sonnet и Claude 3.7 Sonnet стабильно показывают высокие результаты на benchmark-тестах по программированию — SWE-bench и HumanEval, — а интеграция с редактором Cursor сделала их популярными среди профессиональных разработчиков. OpenAI также наращивает усилия: компания недавно закрыла генератор видео Sora, перераспределив вычислительные мощности на обучение и запуск других моделей.

Сооснователь Google Сергей Брин написал внутренний меморандум с призывом «выиграть финальный спринт» в гонке ИИ-разработки.

Image description
Image description · Источник: The Decoder

Одна из особенностей подхода Google — ставка на внутреннюю кодовую базу. Код, который накоплен внутри компании за десятилетия, структурно отличается от публичных репозиториев на GitHub, на которых обучаются большинство коммерческих моделей. Модели, натренированные на этих данных, нельзя выпустить публично — они слишком специфичны. Однако они могут ускорить внутреннюю разработку и помочь создать более сильные модели для конечных пользователей.

Для контроля прогресса Google использует внутренний инструмент Jetski, который фиксирует, насколько активно команды применяют ИИ-ассистента при написании кода. Команды ранжируются по этому показателю — механика, схожая с тем, как Meta отслеживает потребление токенов своими сотрудниками. Брин также обязал всех инженеров Gemini использовать агентов для многошаговых задач, а ряд команд за пределами DeepMind направляет сотрудников на обязательные тренинги по работе с ИИ.

Долгосрочная цель, которую обозначил Брин, выходит за рамки конкурентной борьбы с Anthropic. По его словам, сильный агент для программирования в связке с ИИ, способным решать математические задачи и проводить эксперименты, может в перспективе автоматизировать значительную часть работы самих ИИ-исследователей. Иными словами, речь идёт о системе, которая способна участвовать в собственном совершенствовании — цель, которую в отрасли обсуждают давно, но до практической реализации пока далеко.