За один день и без финансовых вложений разработчик собрал работающий Proof of Concept пространственного 3D-аватара, который запускается прямо в браузере. Вся логика ответов строится на прямых запросах к Google Gemini API через бесплатный ключ из Google ИИ Studio — никаких выделенных серверов и платных бэкендов.
Технически проект представляет собой один HTML/JS-файл, в котором совмещены три независимые библиотеки. Three.js отвечает за рендеринг VRM-модели — формата 3D-аватаров, распространённого в японской аниме-культуре и виртуальных стримах. MediaPipe Face Detection отслеживает положение лица пользователя через веб-камеру. Web Speech API обеспечивает голосовой ввод и синтез речи локально, на устройстве пользователя, без обращения к облачным TTS/STT-сервисам.
| Категория трансферта | Сумма за жизнь (руб.) | % от дохода женщины |
|---|---|---|
| Субсидирование в браке | 4 800 000 | 19,0% |
| Пенсионный профицит (ОПС) | 4 080 000 | 16,2% |
| Алиментные выплаты | 3 240 000 | 12,8% |
| Чистый трансфер при разделе имущества | 3 000 000 | 11,9% |
| Государственные субсидии и маткапитал | 1 700 000 | 6,7% |
| Подарки и личные расходы партнёра | 1 000 000 | 4,0% |
| Dating Free-riding (ухаживания) | 240 000 | 1,0% |
| Пенсия по потере кормильца | 134 400 | 0,5% |
| ИТОГО внешних трансфертов | 18 194 400 | ~72,2% |
Эффект объёма без стереоочков достигается алгоритмом пространственного параллакса. MediaPipe определяет положение глаз и вычисляет горизонтальный сдвиг головы. Когда пользователь смещается влево или вправо, 3D-модель поворачивается по вертикальной оси — мозг воспринимает это как глубину. Одновременно система рассчитывает вектор взгляда: шея, голова и зрачки персонажа плавно следят за лицом, удерживая зрительный контакт. Видеопоток при этом сжат до 320×240 пикселей — достаточно для нейросети трекинга, но позволяет держать 30 FPS даже на слабых мобильных устройствах.
Пространственный параллакс реализован через MediaPipe Face Detection: модель поворачивается вслед за головой пользователя, создавая эффект объёма.
Процедурная анимация решает проблему «застывшего манекена»: в цикле рендеринга постоянно вычисляется тригонометрическая функция времени, которая накладывает лёгкие колебания на грудную клетку и плечи, имитируя дыхание. При загрузке VRM-модели движок рекурсивно обходит дерево объектов и привязывает программные переменные к ключевым костям — плечам, предплечьям, шее, голове и глазам. Такой подход называется процедурным риггингом скелета и позволяет управлять позой персонажа без заранее записанных анимаций.
Значительная часть статьи посвящена не технологии, а её мотивации. Автор строит экономическую модель жизненного цикла условной пары в России: мужчина с зарплатой 80 000 руб., женщина — 60 000 руб. В сводной таблице суммируются субсидирование в браке, пенсионный дисбаланс, алименты, раздел имущества, маткапитал и прочие трансферты. Итог по расчётам автора — около 18,2 млн рублей внешних поступлений за жизнь, что составляет примерно 72% от собственного заработка женщины за 35 лет стажа. Этот раздел носит выраженный полемический характер и содержит ряд допущений, которые автор не верифицирует через независимые источники.
С технической точки зрения проект демонстрирует реальную доступность стека для одиночного разработчика: Gemini API в бесплатном тире, браузерные API без лицензионных затрат, open-source Three.js и MediaPipe. Подобные клиентские архитектуры — без серверной части и облачных зависимостей — становятся всё более распространённым паттерном для быстрых прототипов разговорных агентов. Конкурирующие решения, такие как Character.AI или Replika, работают на проприетарных бэкендах и монетизируют подписку; здесь же вся цепочка собрана из публично доступных инструментов за один рабочий день.


