«Авито» запускает ИИ-сценарий «Разберем гардероб» для создания объявлений по фото

Подготовлено редакцией Malakhov AI

CNews·2 часа назад·1 минРоссия

С 26 июня «Авито» вводит функцию «Разберем гардероб»: мультимодальная модель A-Vision анализирует фотографию одежды и автоматически заполняет карточку товара. Во время тестирования пользователи опубликовали через этот сценарий более 100 тыс. объявлений, в половине случаев не внося правок.

Кратко

—Собственная модель A-Vision определяет тип, бренд, цвет, материал, размер и состояние вещи по снимку со смартфона.
—Новый сценарий сократил количество экранов при создании объявления примерно на 40%.
—В тестовом периоде более 100 тыс. объявлений опубликовано через «Разберем гардероб», из них ~50% без ручной корректировки.
—Функция также предлагает рекомендованную цену на основе анализа текущих цен на аналогичные товары.
—«Авито» ожидает, что к 2030 году более половины объявлений одежды и обуви будет создаваться таким способом.

Глоссарий · 3 термина▾

A-Vision: Собственная мультимодальная модель «Авито», способная анализировать изображения и определять характеристики товаров.
LoRA-адаптеры: Метод эффективной тонкой настройки больших языковых или мультимодальных моделей без полного переобучения всех параметров.
мультимодальная модель: ИИ-модель, обрабатывающая и комбинирующая данные разных типов, например текст и изображения.

26 июня «Авито» запустила сценарий «Разберем гардероб», который позволяет создавать объявления о продаже одежды по одной фотографии. Для этого компания использует собственную мультимодальную модель A-Vision, обученную распознавать характеристики вещей — от типа и бренда до цвета, материала, размера и состояния. Ранее ИИ на платформе мог лишь дополнить описание после того, как пользователь самостоятельно вводил данные, теперь же отправной точкой становится снимок со смартфона.

Тестирование показало, что пользователи приняли новую функцию: опубликовано более 100 тыс. объявлений, причём примерно половина из них не потребовала ручной корректировки ни одного параметра. Кроме того, новый сценарий сократил количество экранов при создании объявления со смартфона примерно на 40%. Встроенная ML-система оценки стоимости также анализирует текущие цены на аналогичные товары и предлагает рекомендованную цену, что упрощает процесс ценообразования.

По словам директора бизнес-направления Lifestyle «Авито» Алексея Гевлича, компания стремится свести процесс продажи к одной фотографии. К 2030 году таким способом планируется публиковать больше половины объявлений одежды и обуви. Для дообучения A-Vision применялись LoRA-адаптеры — метод тонкой настройки больших моделей без полного переобучения, что было необходимо для адаптации к «бытовым» фотографиям, отличающимся от каталожных. Пока функция доступна только для взрослой и детской одежды, но в будущем список категорий планируется расширять.