Как роботехнические компании собирают данные о движениях людей для обучения гуманоидов

Подготовлено редакцией Malakhov AI

MIT Technology Review AI·21 апр.·2 минИсследования

В 2025 году в гуманоидную робототехнику вложили $6,1 млрд венчурного капитала — и компании развернули масштабный сбор данных о движениях человека: от съёмки домашних дел за криптовалюту до экзоскелетов в китайских тренировочных центрах. Гонка за обучающими данными приобретает всё более неожиданные формы.

Кратко

—Венчурные инвестиции в гуманоидных роботов достигли $6,1 млрд только за 2025 год.
—Гиг-работники из Нигерии, Аргентины и Индии снимают себя за домашними делами — данные идут на обучение роботов.
—В Китае операторы в экзоскелетах и VR-шлемах повторяют одно движение сотни раз в день.
—Американская логистическая компания оснастила сотрудников сенсорами движения — в том числе для разработки роботов-замен.
—Обучение на симуляциях давало сбои из-за неточного моделирования трения и упругости — отсюда переход к реальным данным.

Глоссарий · 5 терминов▾

LLM: Large Language Model — большая языковая модель, нейросеть, обученная на текстах для генерации и обработки естественного языка.
Экзоскелет: Внешний механический каркас, надеваемый на тело человека; в контексте сбора данных фиксирует точные параметры движений суставов и конечностей.
Симуляция (в робототехнике): Виртуальная среда, в которой робот обучается выполнять задачи без физического взаимодействия с реальным миром.
Scaling laws: Закономерность, согласно которой качество модели предсказуемо растёт с увеличением объёма данных и вычислительных ресурсов.
Гуманоидный робот: Робот с телом, приближённым по форме и пропорциям к человеческому, способный работать в пространствах, созданных для людей.

Несколько месяцев назад журналист MIT Technology Review получил приглашение в приложение, которое платит криптовалютой за видео с бытовыми действиями: положить еду в миску, разогреть в микроволновке, достать. Параллельно другой сервис предлагал дистанционно управлять роботизированной рукой в Шэньчжэне, помогая ей справляться с головоломками. За этими странными предложениями стоит вполне конкретная индустриальная логика.

Роботехнические компании столкнулись с той же проблемой, что и разработчики языковых моделей несколько лет назад, — нехваткой обучающих данных. Когда в 2022 году вышел ChatGPT, стало очевидно: LLM обучаются на огромных массивах текста, и похожий подход можно применить к роботам. Только вместо слов нужны данные о движениях тела. Интернет-архива человеческих жестов не существует, поэтому компании искали обходные пути. Роботов учили в виртуальных симуляциях, но те не воспроизводят реальное поведение материалов — трение, упругость, вес предметов. Роботы, обученные в симуляторах, буквально спотыкались при переносе в реальный мир.

Решением стал сбор реальных данных — трудоёмкий, дорогой и всё более изощрённый. Ранние академические проекты выглядели скромно: лаборатории записывали часы видео, на которых люди переворачивали вафли или убирали со стола, используя камеры и ручные захваты. Данные публиковались в открытом доступе. Но когда в отрасль пришли венчурные деньги — $6,1 млрд только в гуманоидов за 2025 год — конкуренция резко обострилась. В Китае появились специализированные тренировочные центры, где операторы в экзоскелетах и VR-гарнитурах выполняют одно и то же движение — например, протирают стол — сотни раз в день. Гиг-работники из Нигерии, Аргентины и Индии снимают себя дома за бытовыми делами.

Гиг-работники из Нигерии, Аргентины и Индии снимают себя за домашними делами — данные идут на обучение роботов.

Один из наиболее показательных случаев — американская логистическая компания, оснастившая сотрудников сенсорами движения во время переноски коробок. Официальная цель — изучение производственных травм, но параллельная — сбор данных для обучения роботов, которые могут заменить этих же людей. Физические работники превращаются в поставщиков обучающих данных для собственных конкурентов.

При этом фундаментальные вопросы остаются без ответа. Неясно, достижим ли масштаб, необходимый для технического скачка: сколько тысяч видеозаписей с открыванием микроволновки нужно, чтобы робот научился готовить ужин? Какова рыночная стоимость одного такого клипа? Венчурные инвесторы ставят на то, что ответы появятся в ближайшие год-два. Пока же отрасль находится в точке, где методы сбора данных опережают понимание того, сколько этих данных реально нужно.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ