Исследователи из Sber ИИ Lab (тимлид Дмитрий Валов) представили работу FinTRACE, посвящённую анализу банковских транзакций с помощью больших языковых моделей. Основная проблема в том, что LLM плохо справляются с сырыми платёжными данными: если просто скормить модели таблицу с датами, суммами и кодами категорий, её точность (MCC) не превышает 0,30, тогда как специализированные модели вроде CatBoost или TabPFN показывают 0,48. Разрыв возникает из-за того, что транзакции содержат предсказательный сигнал не в словах, а в закономерностях — регулярности, дисперсии, концентрации категорий. Коды категорий и идентификаторы мерчантов у каждого банка свои и не несут устойчивого лингвистического смысла.

Ключевая гипотеза FinTRACE заключается в том, что модель не умеет работать с транзакциями не из-за недостатка генерации, а из-за отсутствия структурированного представления, где связи между показателями были бы явно прописаны. Вместо сериализации сырой таблицы в текст авторы строят базу знаний (KB), организованную в три слоя. Первый слой — сырые показатели (feature essences): средний интервал между операциями, дисперсия сумм, энтропия категорий и так далее. Второй слой собирает из этих фич интерпретируемые поведенческие паттерны — например, финансовая стабильность или поведенческая лояльность. Третий слой — портреты клиентов, которые уже можно напрямую подавать в задачу оттока или кредитного риска.

МетодMCC
LLM (готовые, 0/4/16 примеров)0,30
Специализированные модели (TabPFN, CatBoost, CoLES)0,48

Такой подход позволяет избежать дообучения модели на размеченных тысячах примеров. Новые источники данных достаточно описать на уровне фич или паттернов, и модель на инференсе сможет их использовать через обновлённый промпт. Авторы утверждают, что при такой организации данных LLM сокращают разрыв с узкоспециализированными моделями, сохраняя гибкость языкового интерфейса. Работа принята на конференцию SIGIR 2026, что подтверждает интерес академического сообщества к нейросимвольным методам для финансовых данных.