За один день и без финансовых вложений разработчик собрал работающий Proof of Concept пространственного 3D-аватара, который запускается прямо в браузере. Вся логика ответов строится на прямых запросах к Google Gemini API через бесплатный ключ из Google ИИ Studio — никаких выделенных серверов и платных бэкендов.

Технически проект представляет собой один HTML/JS-файл, в котором совмещены три независимые библиотеки. Three.js отвечает за рендеринг VRM-модели — формата 3D-аватаров, распространённого в японской аниме-культуре и виртуальных стримах. MediaPipe Face Detection отслеживает положение лица пользователя через веб-камеру. Web Speech API обеспечивает голосовой ввод и синтез речи локально, на устройстве пользователя, без обращения к облачным TTS/STT-сервисам.

Категория трансфертаСумма за жизнь (руб.)% от дохода женщины
Субсидирование в браке4 800 00019,0%
Пенсионный профицит (ОПС)4 080 00016,2%
Алиментные выплаты3 240 00012,8%
Чистый трансфер при разделе имущества3 000 00011,9%
Государственные субсидии и маткапитал1 700 0006,7%
Подарки и личные расходы партнёра1 000 0004,0%
Dating Free-riding (ухаживания)240 0001,0%
Пенсия по потере кормильца134 4000,5%
ИТОГО внешних трансфертов18 194 400~72,2%

Эффект объёма без стереоочков достигается алгоритмом пространственного параллакса. MediaPipe определяет положение глаз и вычисляет горизонтальный сдвиг головы. Когда пользователь смещается влево или вправо, 3D-модель поворачивается по вертикальной оси — мозг воспринимает это как глубину. Одновременно система рассчитывает вектор взгляда: шея, голова и зрачки персонажа плавно следят за лицом, удерживая зрительный контакт. Видеопоток при этом сжат до 320×240 пикселей — достаточно для нейросети трекинга, но позволяет держать 30 FPS даже на слабых мобильных устройствах.

Пространственный параллакс реализован через MediaPipe Face Detection: модель поворачивается вслед за головой пользователя, создавая эффект объёма.

Процедурная анимация решает проблему «застывшего манекена»: в цикле рендеринга постоянно вычисляется тригонометрическая функция времени, которая накладывает лёгкие колебания на грудную клетку и плечи, имитируя дыхание. При загрузке VRM-модели движок рекурсивно обходит дерево объектов и привязывает программные переменные к ключевым костям — плечам, предплечьям, шее, голове и глазам. Такой подход называется процедурным риггингом скелета и позволяет управлять позой персонажа без заранее записанных анимаций.

Значительная часть статьи посвящена не технологии, а её мотивации. Автор строит экономическую модель жизненного цикла условной пары в России: мужчина с зарплатой 80 000 руб., женщина — 60 000 руб. В сводной таблице суммируются субсидирование в браке, пенсионный дисбаланс, алименты, раздел имущества, маткапитал и прочие трансферты. Итог по расчётам автора — около 18,2 млн рублей внешних поступлений за жизнь, что составляет примерно 72% от собственного заработка женщины за 35 лет стажа. Этот раздел носит выраженный полемический характер и содержит ряд допущений, которые автор не верифицирует через независимые источники.

С технической точки зрения проект демонстрирует реальную доступность стека для одиночного разработчика: Gemini API в бесплатном тире, браузерные API без лицензионных затрат, open-source Three.js и MediaPipe. Подобные клиентские архитектуры — без серверной части и облачных зависимостей — становятся всё более распространённым паттерном для быстрых прототипов разговорных агентов. Конкурирующие решения, такие как Character.AI или Replika, работают на проприетарных бэкендах и монетизируют подписку; здесь же вся цепочка собрана из публично доступных инструментов за один рабочий день.