Искусственный интеллект на страже программ лояльности
Читая эту статью, не стоит забывать, что ни один из описанных ниже методов не является универсальным решением по предотвращению мошенничества. Программы лояльности отличаются разнообразием в зависимости от отрасли, желаемых бизнес-целей, конфигурации и ряда других факторов. Более того, ни одна система машинного обучения не может полностью заменить традиционные меры по защите от мошенничества, такие как настройка предельных значений начисления и списания баллов, управление количеством зарегистрировавшихся участников, проверка данных, мониторинг числа рискованных транзакций или использование механизма дедупликации.
Решения на базе машинного обучения можно использовать в качестве высокоэффективных дополнений к имеющимся мерам по предотвращению мошенничества, но их ни в коем случае нельзя рассматривать как их замену.
Что такое «мошенничество в программе лояльности»?
Этот термин с трудом поддается определению. Еще сложнее придумать краткое значение, которое затем можно с легкостью преобразовать в алгоритм для использования разными механизмами автоматизации. По большей части, махинации происходят тогда, когда мошенники находят лазейку в правилах участия или техническую уязвимость системы, отвечающей за управление программой лояльности. Как правило, такие мошеннические действия ведут к непропорциональному соотношению между операциями начисления и списания на счету участника.
Если предположить, что подавляющее большинство участников программы соблюдают ее правила, то любые мошеннические действия определяются как отклонения от допустимых транзакций по карте лояльности. Действительно, определение отклонений в базах данных большого размера — один из хорошо зарекомендовавших себя сценариев для использования машинного обучения.
Традиционно, решения на базе машинного обучения разделяют на две основных категории: «обучение с учителем» («supervised learning») и «обучение без учителя» («unsupervised learning).
Системы, использующие метод «обучения с учителем», строят алгоритмы и прогностические модели, используя данные на входе и выходе. Например, систему снабжают изображениями животных с пометками «кошка» и «собака». После достаточного количества наблюдений система в состоянии различать и самостоятельно отсортировать на кошек и собак непомеченные изображения. Обучение с учителем имеет свои преимущества, но также и ограничения. Система с большей вероятностью приходит к таким же выводам, как и человек. Однако у нее могут возникнуть трудности при работе с новой информацией. Если к изображениям кошек и собак добавить, например, лошадь, то система ошибочно занесет его в одну или другую категорию.
В программах лояльности метод «обучения с учителем» используется для распознавания данных транзакций, учетных записей или других операций как мошеннических. С помощью классификатора машинного обучения можно сравнить новые транзакции по конкретным признакам с транзакциями, ранее подтвержденными как мошеннические, чтобы определить степень их подобия для идентификации мошеннических действий.
В отличие от предыдущего метода, «обучение без учителя» пытается построить модель только на данных на входе, которые не классифицированы и не помечены. Система, использующая данный метод, группирует данные на базе кластерного анализа по признакам сходства и отличия, даже если заранее не указаны категории. Алгоритмы, построенные на обучении без учителя, могут выполнять более сложные задачи в отличие от систем на базе обучения с учителем, и могут быть полезны, когда вы не совсем уверены, что нужно искать. Однако могут быть более непредсказуемыми. Например, они могут самостоятельно определить, как отсортировать кошек от собак. Но также могут добавить непредвиденные или нежелательные категории при работе с необычными породами кошек или собак, создавая беспорядок вместо порядка.
Хотя наличие источника данных с определенными заранее признаками мошеннических действий может принести много пользы, компания Comarch фокусируется на методике обучения без учителя, поскольку их можно адаптировать под более широкий круг внедрений. Несмотря на то, что программы лояльности, как правило, имеют разные бизнес-цели и задачи, они предназначены главным образом для вознаграждения и удержания постоянных клиентов, улучшения узнаваемости брендов и повышения объемов продаж.
Если принять относительно статическую конфигурацию программы лояльности, то необходимо наличие некоторых шаблонов взаимодействия между программой и ее участниками, которые можно измерить, например:
- коэффициент начисления и использования баллов – определение типичного соотношения количества транзакций по начислению баллов к транзакциям использования большинством участников;
- скорость накопления – изучение данных о темпах начисления бонусных баллов;
- типичная частота транзакций по начислению и использованию бонусных баллов;
- типичный срок действия учетной записи;
- распределение между операциями покупки и начисления баллов;
- определение связи между временем с момента регистрации и общим количеством взаимодействий.
Системы машинного обучения могут распознавать эти и похожие шаблоны в транзакционных данных программы, а затем определять учетные записи или отдельные транзакции, которые не соответствуют идентифицированной модели.
Использование машинного обучения в программах лояльности
Цель большинства программ лояльности – награждение клиентов определенным количеством бонусных баллов за лояльность в соответствии со стоимостью конкретной покупки. Как правило, отношение между общими затратами участника и начисленными баллами является практически линейным для большинства программ, как показано на диаграмме ниже.
Например, если поставлена задача проанализировать простейшую базовую конфигурацию программы лояльности, где за каждый потраченный рубль клиент получает 1 бонусный балл, следует ожидать идеального линейного соотношения между общими затратами участника и суммой начисленных баллов. В реальных условиях такие программы огромная редкость. Операторы программ обычно предлагают дополнительные акции, специальные предложения и т. д. Поэтому необходимо задавать максимально допустимое отклонение от идеального линейного соотношения, приемлемое в таких случаях. Если при постоянном отслеживании этих показателей в отношении некоторых учетных записей участников наблюдаются выбросы, это может значить следующее:
Следует рассматривать оба случая. Поэтому отдел R&D Comarch принял решение использовать машинное обучение для определения отклонений и мошеннических действий.
Автокодировщики – основной метод машинного обучения, который использует Comarch. Это тип искусственной нейронной сети, обученной разбирать данные на составляющие, после чего их восстанавливать, как показано на диаграмме выше. Хотя на первый взгляд может показаться бессмысленным разбор данных только для того, чтобы получить то же самое, на самом деле это очень полезно для ряда приложений. Ключевым моментом здесь является то, что автокодировщик сводит (кодирует) входные данные к некоторым ключевым функциям, которые он определяет неконтролируемым образом. Отсюда и название «автокодировщик» – он автоматически кодирует вводные данные.
Как пример можно рассмотреть автокодировщик велосипеда, где вводными данными выступает его изображение. Автокодировщик разбирает велосипед на компоненты, например, руль, два колеса, сидение и т.д), а затем восстанавливает исходный объект. Конечно, при восстановлении может произойти некоторая потеря точности («ошибка реконструкции»), но в общем на выходе мы получим изображение велосипеда.
Предположим, что в автокодировщик загрузили изображение трехколесного велосипеда, которое пытаются выдать за обычный велосипед. В процессе разбора трёхколёсного велосипеда на компоненты, свойственные велосипеду, реконструированная версия будет действительно отличаться, то есть будет присутствовать отклонение.
С целью выявления мошенничества в программе лояльности разрабатывается алгоритм для автокодировщика на базе реальных данных взаимодействия «участник-программа» и бонусные балы на балансе. Для определения его эффективности восстановленные данные сравниваются с исходными вводными данными. Чем хуже автокодировщик восстанавливает данные, тем выше вероятность того, что присутствует отклонение и тем выше подозрения о мошенничестве. Таким образом, алгоритм позволяет определить учетные записи, для которых характерно нетипичное соотношение накопленных и списанных баллов, быстрое накопление и списание баллов, активная коррекция количества баллов вручную, повторение транзакций и другие необычные шаблоны.
Решения на базе машинного обучения могут помочь предотвращать и выявлять мошеннические действия, которые крайне тяжело определить другим путем. Банки и платежные системы уже давно это поняли и активно используют искусственный интеллект, чтобы минимизировать потери. Дело за лояльностью!
Автор: Людмила Москаль