Накануне Google I/O компания раскрыла детали пакета Gemini Intelligence — набора ИИ-функций для Android, которые переводят взаимодействие с телефоном с уровня «спросить» на уровень «сделать». Первыми носителями станут Samsung Galaxy S26 и Google Pixel 10, релиз запланирован на лето 2026 года. Позднее функциональность распространится на умные часы, автомобили, гарнитуры и ноутбуки.

Центральный элемент пакета — ИИ-агент, способный выполнять многошаговые задачи без постоянного участия пользователя. Классический пример из анонса: агент берёт список покупок из приложения для заметок и самостоятельно добавляет позиции в корзину интернет-магазина. Аналогичная логика применяется к бронированию поездок — агент проходит несколько экранов и форм вместо пользователя. Это принципиально отличается от голосового ассистента, который лишь отвечает на вопросы: здесь система действует в интерфейсах приложений как человек.

ФункцияГде работаетЧто делает
Gemini AgentAndroid-приложенияБронирует поездки, переносит списки покупок в корзину
Автозаполнение формChromeЗаполняет сложные формы по контексту, только при включении пользователем
СуммаризацияChromeСжимает веб-страницы до ключевых тезисов
RamblerGboardПревращает голосовые мысли в готовый текст, поддержка нескольких языков
Create My WidgetAndroidГенерирует виджеты по текстовому описанию пользователя

В браузере Chrome Gemini получает две роли. Первая — суммаризация веб-страниц: модель сжимает длинный материал до ключевых тезисов прямо в браузере. Вторая — интеллектуальное автозаполнение форм, которое выходит за рамки стандартного хранения паролей и адресов: система анализирует контекст формы и подставляет релевантные данные. Функция намеренно сделана opt-in — пользователь должен включить её явно, что снижает риски нежелательной передачи данных.

ИИ-агент может переносить список покупок из заметок прямо в корзину интернет-магазина и бронировать поездки без участия пользователя.

Отдельного внимания заслуживает Rambler — новый режим в клавиатуре Gboard. Пользователь говорит вслух необработанные мысли, а система превращает их в связное текстовое сообщение. Поддерживается одновременный ввод на нескольких языках — актуально для многоязычной аудитории, которая переключается между языками внутри одного разговора.

Ещё одна функция — «Create My Widget»: пользователь описывает словами, какой виджет хочет видеть на экране (например, подборку рецептов или погоду для конкретного маршрута), и система генерирует его без программирования.

Контекст анонса важен для понимания стратегии Google. В начале мая компания закрыла Project Mariner — экспериментальный браузерный агент, который управлял вкладками Chrome от имени пользователя. Его технологии не были выброшены: они вошли в состав нового Gemini Agent, который теперь интегрирован в Android-экосистему. Это типичный для Google паттерн — перевод лабораторных экспериментов в продуктовые релизы после проверки концепции.

На рынке ИИ-агентов для потребителей Google конкурирует прежде всего с OpenAI, чей оператор компьютера (Computer Use в исполнении Anthropic и аналогичные функции у OpenAI) также позволяет моделям управлять интерфейсами. Ключевое отличие подхода Google — глубокая интеграция на уровне операционной системы Android, а не надстройка поверх браузера. Это даёт агентам доступ к нативным приложениям, что теоретически делает их надёжнее и быстрее браузерных решений. Насколько это преимущество реализуется на практике, станет ясно после летнего релиза.