Редакция MIT Technology Review регулярно отбирает направления, которые, по её оценке, определяют реальный ход развития отрасли — в противовес шуму вокруг очередных анонсов. В последнем таком обзоре десять тем разбиты на три группы: изменения внутри самой технологии, выход ИИ в реальные рабочие процессы и последствия масштабирования.
Одна из наиболее неочевидных тем — данные для гуманоидных роботов. Логика здесь прямая: текстовые LLM выросли на огромных корпусах текстов из интернета, но для обучения роботов нужны данные о том, как человек двигается и взаимодействует с физическими объектами. Такие данные нельзя просто скачать — их нужно собирать. Симуляции, которые раньше использовались как замена, плохо воспроизводят реальные свойства среды: трение, упругость, мелкие отклонения. Поэтому компании переходят к записи движений в реальных условиях — через тренировочные центры с VR-оборудованием и экзоскелетами, удалённое управление роботами, запись действий сотрудников. Этот сбор данных быстро превращается в отдельную гонку на фоне роста инвестиций в гуманоидную робототехнику. Главный открытый вопрос — можно ли вообще собрать нужный объём и превратить его в окупаемую технологию.
Параллельно идёт переосмысление самих LLM. Следующий этап — не отказ от этой архитектуры, а её переработка: снижение вычислительных затрат, более надёжная работа с длинным контекстом, эксперименты с альтернативами трансформерам. Один из подходов — модели, разбитые на специализированные части, где в каждый момент активна только нужная. Другое направление — «модели мира»: системы, которые формируют внутреннее представление о физической среде и способны предсказывать последствия действий. Языковая модель может правдоподобно описывать мир, но это не означает, что она умеет в нём ориентироваться. Именно здесь многие исследователи видят ключевой шаг после эпохи LLM — особенно применительно к робототехнике и автономным системам.
Следующее поколение LLM делает ставку на снижение вычислительных затрат и надёжную работу с длинным контекстом, а не просто на увеличение размера модели.

На геополитическом уровне MIT Technology Review фиксирует смещение баланса сил. Пока американские компании монетизируют доступ к сильным моделям через API, китайские лаборатории делают ставку на открытые веса. Выход DeepSeek R1 показал, что китайские игроки способны приближаться к уровню ведущих западных систем при меньших затратах. Вслед за DeepSeek по этому пути пошли Alibaba, Moonshot, MiniMax и Z.ai. Для разработчиков открытые модели означают более низкий порог входа: можно развернуть модель на собственной инфраструктуре, дообучить под задачу и не зависеть от внешнего провайдера. Обратная сторона — ограничения местной модерации контента и вопросы к происхождению части возможностей. Но в прикладном смысле тренд уже сложился: рынок становится менее централизованным.
Отдельный блок обзора посвящён выходу ИИ за пределы чата. Многоагентные системы — группы специализированных агентов с разными ролями — уже применяются в разработке кода и начинают проникать в офисные процессы. Один агент пишет код, другой тестирует, третий исправляет ошибки, четвёртый координирует. Авторы сравнивают потенциал такого подхода с конвейером в производстве — но указывают и на риски: при выходе в корпоративные, финансовые или медицинские инфраструктуры цена ошибок генеративных моделей резко возрастает. Схожая логика работает в науке: крупные лаборатории пытаются превратить ИИ из вспомогательного инструмента в участника исследовательского процесса — с генерацией гипотез, проектированием экспериментов и интерпретацией результатов через многоагентные связки.



