Мы стараемся придерживаться двух принципиальных условий:
1.
Декомпозируемость и интерпретируемость моделей. Если делаем рекомендации — это не должен быть чёрный ящик, который просто выдаст готовый набор из 10 товаров для конкретного покупателя. Нам нужно понимать и контролировать высокоуровневую бизнес-логику:
— как учитываем историю покупателя,
— как рассматриваем его онлайн-просмотры и покупки: смешиваем их вместе или нет,
— как понимаем, что два товара похожи,
— хотим ли повторно советовать то, что клиент уже покупал не раз,
— хотим ли отдавать приоритет более свежим действиям и т. д.
Это позволяет быть уверенными в корректности нашего основного процесса для нового клиента со своими особенностями. А нейронная сеть в это время легко начнёт чудить на загрязнённых или просто несбалансированных данных — найдёт несуществующие зависимости между полом покупателя и цветом бутылки кефира. При этом ловить несоответствие и разбирать частные случаи при необходимости — довольно сложная задача.
2.
Контроль качества данных клиента (магазина) и пригодности нашего алгоритма машинного обучения. Мы предлагаем постоянную диагностику — работает ли машинное обучение, даёт ли прирост относительно классических механик, есть ли узкие места по данным именно с учётом специфики нашей модели.
С помощью такого подхода мы прогнозируем, насколько окажется полезным ML-алгоритм для клиента, у которого в магазине 100 тысяч товаров и кроме истории в 10 000 покупок за полгода больше ничего не доступно. Или окупится ли сложный ML, если у вашего покупателя 90% бонусных карт — одноразовые: он что-то купил, получил карту, исчез, а потом возвращается как новый клиент с пустой историей.
Кроме того, мы можем посоветовать, что клиенту сделать с разметкой, ассортиментом, логированием и т. д.
Мы используем в основном классические модели для построения персонализированных рекомендаций: коллаборативная фильтрация, item-to-item, статистика совстречаемости. Не самый передовой, но White Box подход, когда мы видим и понимаем все факторы, которые важны ML-модели при принятии решений.
Есть и нейронные сети, но в контролируемом периметре — не как окончательный инструмент принятия решений.
Рентабельность инвестиций в настройку рекомендаций варьируется от проекта к проекту. Zarina и Mindbox провели AB-тест, который подтвердил, что показ карточек товара с рекомендациями
приносит больше дохода за сеанс, чем вариант без рекомендаций. А настройка персонализации продуктовых рекомендаций онлайн- и офлайн-продаж для «Музторга» привела к окупаемости вложений, при которой каждый вложенный рубль в рекомендательный модуль
приносит 3,26 ₽.