Челябинские ученые научили нейросеть распознавать подозрительные транзакции

Старший научный сотрудник Южно-Уральского государственного университета Алексей Ручай и его коллеги обучили искусственный интеллект распознавать подозрительные банковские транзакции с помощью градиентного бустинга. Результат испытаний на общедоступной базе транзакций Elliptic показал высокий уровень безошибочности – 99,21 % верных попаданий, что впервые удовлетворяет требованиям банковской сферы к таким алгоритмам. Конкурирующие группы ранее добивались безошибочности 97,8 %, что считалось недостаточным.

Транзакция – действие банка с деньгами, перевод их с одного счёта на другой и так далее. В представлении компьютера транзакция – это строка данных, в которой отображается история движения денежных средств.

Некоторые транзакции могут казаться подозрительными – налоговикам и криминалистам. Скажем, если некто постоянно получает одинаковые поступления – не занимается ли он незаконной торговлей? Некоторые суммы могут натолкнуть на мысль и о распространении наркотиков. Борьба с «отмыванием денег» – важное условие финансовой стабильности и безопасности. Однако отслеживать опасность среди тысяч одновременных транзакций – задача не для человека, а для машинного разума.

Задача искусственного интеллекта – научиться выявлять подозрительные транзакции. Формулировать причину «человеческим языком» компьютер не обязан, ему достаточно создать математический критерий. Для обучения используются уже наработанные базы транзакций, где подозрительные строки помечены заранее. Хорошо, чтобы база была сбалансированной, то есть «нормальных» и «плохих» транзакций в ней должно быть примерно поровну. В реальной деятельности банка подозрительные транзакции составляют очень небольшую долю. Получив данные «из жизни», система потратит на обучение больше времени, но достигнет менее эффективного результата.

Старший научный сотрудник ЮУрГУ, кандидат физико-математических наук Алексей Ручай и его коллеги использовали для обучения и тестирования своей системы базу Elliptic, в которой подобраны транзакции биткоина. Эта база не сбалансирована: в ней примерно двести тысяч транзакций, из которых десятая часть – подозрительна. Учёным, чтобы подготовить её, пришлось предварительно провести ресемплинг.

База Elliptic известна, и конечно привлекала внимание других специалистов. Те опробовали разные методы машинного обучения с занятными названиями: «случайный лес», «логистическая регрессия», «наивный байесовский классификатор», «метод многослойных персептронов». Алексею Ручаю и его коллегам удалось перекрыть все предыдущие результаты с помощью градиентного бустинга.

Бустинг (от слова «усиление») помогает повысить точность предсказаний. Например, слабая модель, обученная преимущественно на белых кошках, может ошибочно распознать чёрную. Бустинг создаёт новые модели, в которых ошибкам, сделанным в прошлый раз, придаётся большее внимание.

Другими словами, система, прожив «эпоху» – то есть пройдя итерацию, перебрав всю базу данных, в новой эпохе концентрируется уже на тех примерах, на которых в прошлый раз дала ложный результат.

Слово «градиентный» пришло из анализа, такой бустинг подобен «градиентному спуску», оптимизирующему функцию, находящему её максимальные и минимальные значения.

Главный критерий работы искусственного интеллекта – безошибочность ответов. Стопроцентной безошибочности не может быть в принципе. Результат, полученный алгоритмом учёных ЮУрГУ XGBClassifier, – 0,9921 верных ответов по базе Elliptic, тогда как предыдущий опубликованный результат составлял лишь 0,9780. Разница между двумя этими числами принципиальна: прежнее не удовлетворяло требованиям к надежности выявления аномальных транзакций, теперь условия выполнены.

Результат опубликован в зарубежном журнале «Communications in Computer and Information Science», выпускаемом издательством Springer Verlag, а также в серии «Безопасность в цифровой среде» Вестника УрФО и Челябинском физико-математическом журнале. Алгоритм может быть использован как в повседневной работе службы безопасности банка, так и при контроле за «цифровой валютой».

Остап Давыдов
Вы нашли ошибку в тексте:
Просто нажмите кнопку «Сообщить об ошибке» — этого достаточно. Также вы можете добавить комментарий.