26 июня «Авито» запустила сценарий «Разберем гардероб», который позволяет создавать объявления о продаже одежды по одной фотографии. Для этого компания использует собственную мультимодальную модель A-Vision, обученную распознавать характеристики вещей — от типа и бренда до цвета, материала, размера и состояния. Ранее ИИ на платформе мог лишь дополнить описание после того, как пользователь самостоятельно вводил данные, теперь же отправной точкой становится снимок со смартфона.
Тестирование показало, что пользователи приняли новую функцию: опубликовано более 100 тыс. объявлений, причём примерно половина из них не потребовала ручной корректировки ни одного параметра. Кроме того, новый сценарий сократил количество экранов при создании объявления со смартфона примерно на 40%. Встроенная ML-система оценки стоимости также анализирует текущие цены на аналогичные товары и предлагает рекомендованную цену, что упрощает процесс ценообразования.
По словам директора бизнес-направления Lifestyle «Авито» Алексея Гевлича, компания стремится свести процесс продажи к одной фотографии. К 2030 году таким способом планируется публиковать больше половины объявлений одежды и обуви. Для дообучения A-Vision применялись LoRA-адаптеры — метод тонкой настройки больших моделей без полного переобучения, что было необходимо для адаптации к «бытовым» фотографиям, отличающимся от каталожных. Пока функция доступна только для взрослой и детской одежды, но в будущем список категорий планируется расширять.
Новый сценарий сократил количество экранов при создании объявления примерно на 40%.

