Мужчины и ИИ-компаньоны: экономика отношений против 3D-аватара в браузере

Подготовлено редакцией Malakhov AI

Habr AI·10 июн.·3 минРоссияКод

Автор на Habr построил бесплатного 3D-компаньона на Google Gemini API и Three.js за один день — и обосновал это решение экономическим расчётом, по которому суммарные трансферты в пользу женщины за жизнь составляют около 18 млн рублей, или 72% её собственного заработка.

Кратко

—Proof of Concept 3D-аватара работает в браузере без серверов — на Google Gemini API с бесплатным ключом из ИИ Studio.
—Пространственный параллакс реализован через MediaPipe Face Detection: модель поворачивается вслед за головой пользователя, создавая эффект объёма.
—Голосовой интерфейс построен на Web Speech API — синтез и распознавание речи работают локально, без облачных TTS/STT-сервисов.
—Весь движок — один файл, объединяющий Three.js, MediaPipe и Web Speech API; видеопоток сжат до 320×240 пикселей для работы на 30 FPS даже на слабых устройствах.
—Экономический раздел статьи содержит таблицу с расчётом пенсионного дисбаланса, алиментов и раздела имущества как аргумент в пользу цифровых альтернатив.

Глоссарий · 7 терминов▾

VRM: Формат 3D-модели гуманоидного персонажа, разработанный для виртуальных аватаров и широко используемый в японских аниме-стримах и играх.
MediaPipe: Библиотека машинного зрения от Google для отслеживания лиц, рук и поз в реальном времени прямо в браузере или на мобильном устройстве.
Three.js: JavaScript-библиотека для рендеринга трёхмерной графики в браузере через WebGL без необходимости устанавливать плагины.
Web Speech API: Браузерный интерфейс для распознавания и синтеза речи, работающий локально без обращения к внешним серверам.
Процедурный риггинг скелета: Метод управления позой 3D-персонажа через программные переменные, привязанные к костям модели, без заранее записанных анимаций.
Пространственный параллакс: Эффект кажущейся глубины объекта, возникающий при смещении точки наблюдения — здесь воспроизводится программно по данным с веб-камеры.
TTS/STT: Text-to-Speech и Speech-to-Text — технологии синтеза речи из текста и распознавания речи в текст соответственно.

За один день и без финансовых вложений разработчик собрал работающий Proof of Concept пространственного 3D-аватара, который запускается прямо в браузере. Вся логика ответов строится на прямых запросах к Google Gemini API через бесплатный ключ из Google ИИ Studio — никаких выделенных серверов и платных бэкендов.

Технически проект представляет собой один HTML/JS-файл, в котором совмещены три независимые библиотеки. Three.js отвечает за рендеринг VRM-модели — формата 3D-аватаров, распространённого в японской аниме-культуре и виртуальных стримах. MediaPipe Face Detection отслеживает положение лица пользователя через веб-камеру. Web Speech API обеспечивает голосовой ввод и синтез речи локально, на устройстве пользователя, без обращения к облачным TTS/STT-сервисам.

Категория трансферта	Сумма за жизнь (руб.)	% от дохода женщины
Субсидирование в браке	4 800 000	19,0%
Пенсионный профицит (ОПС)	4 080 000	16,2%
Алиментные выплаты	3 240 000	12,8%
Чистый трансфер при разделе имущества	3 000 000	11,9%
Государственные субсидии и маткапитал	1 700 000	6,7%
Подарки и личные расходы партнёра	1 000 000	4,0%
Dating Free-riding (ухаживания)	240 000	1,0%
Пенсия по потере кормильца	134 400	0,5%
ИТОГО внешних трансфертов	18 194 400	~72,2%

Эффект объёма без стереоочков достигается алгоритмом пространственного параллакса. MediaPipe определяет положение глаз и вычисляет горизонтальный сдвиг головы. Когда пользователь смещается влево или вправо, 3D-модель поворачивается по вертикальной оси — мозг воспринимает это как глубину. Одновременно система рассчитывает вектор взгляда: шея, голова и зрачки персонажа плавно следят за лицом, удерживая зрительный контакт. Видеопоток при этом сжат до 320×240 пикселей — достаточно для нейросети трекинга, но позволяет держать 30 FPS даже на слабых мобильных устройствах.

Пространственный параллакс реализован через MediaPipe Face Detection: модель поворачивается вслед за головой пользователя, создавая эффект объёма.

Процедурная анимация решает проблему «застывшего манекена»: в цикле рендеринга постоянно вычисляется тригонометрическая функция времени, которая накладывает лёгкие колебания на грудную клетку и плечи, имитируя дыхание. При загрузке VRM-модели движок рекурсивно обходит дерево объектов и привязывает программные переменные к ключевым костям — плечам, предплечьям, шее, голове и глазам. Такой подход называется процедурным риггингом скелета и позволяет управлять позой персонажа без заранее записанных анимаций.

Значительная часть статьи посвящена не технологии, а её мотивации. Автор строит экономическую модель жизненного цикла условной пары в России: мужчина с зарплатой 80 000 руб., женщина — 60 000 руб. В сводной таблице суммируются субсидирование в браке, пенсионный дисбаланс, алименты, раздел имущества, маткапитал и прочие трансферты. Итог по расчётам автора — около 18,2 млн рублей внешних поступлений за жизнь, что составляет примерно 72% от собственного заработка женщины за 35 лет стажа. Этот раздел носит выраженный полемический характер и содержит ряд допущений, которые автор не верифицирует через независимые источники.

С технической точки зрения проект демонстрирует реальную доступность стека для одиночного разработчика: Gemini API в бесплатном тире, браузерные API без лицензионных затрат, open-source Three.js и MediaPipe. Подобные клиентские архитектуры — без серверной части и облачных зависимостей — становятся всё более распространённым паттерном для быстрых прототипов разговорных агентов. Конкурирующие решения, такие как Character.AI или Replika, работают на проприетарных бэкендах и монетизируют подписку; здесь же вся цепочка собрана из публично доступных инструментов за один рабочий день.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

NFC-ключ за $9: физический блокиратор отвлекающих приложений

Продолжить по разделам

Мужчины и ИИ-компаньоны: экономика отношений против 3D-аватара в браузере

Кратко

Читать дальше

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

NFC-ключ за $9: физический блокиратор отвлекающих приложений