Насколько серьезной проблемой является борьба с отмыванием денег (AML)? Во всем мире это обходится предприятиям в 2 триллиона долларов каждый год и напрямую связано с целым рядом преступных действий. Для финансовых организаций AML может стать непреодолимым препятствием. Среди миллионов транзакций команды по борьбе с отмыванием денег должны искать тот небольшой, но значительный процент проблемных транзакций. А это требует много времени и ресурсов.
Хорошая новость заключается в том, что искусственный интеллект — идеальное противоядие от отмывания денег. Еще лучше то, что мы начинаем не с нуля. В большинстве финансовых учреждений действует процесс борьбы с отмыванием денег (AML), к которому можно подключить искусственный интеллект для повышения эффективности.
Традиционно транзакции выполняются через систему, основанную на правилах, которая определяет, является ли транзакция подозрительной. Если транзакция считается потенциально подозрительной, подается отчет о подозрительной деятельности (SAR), который проходит ручную проверку. Это неэффективный способ делать что-то, и он создает большую кучу предупреждений, которые, как правило, не оцениваются — процесс, который создает много ложных срабатываний.
Внедрив ИИ в существующий процесс, мы можем классифицировать подозрительные действия, определить, какие из них действительно заслуживают приоритетного расследования, и сделать весь процесс более эффективным, позволяя экспертам в первую очередь сосредоточить свое внимание на предупреждениях о самом высоком риске.
Как выглядит процесс построения модели?
Скорость. Качество. Прозрачность. Это три критерия, которые необходимы для любой успешной программы по борьбе с отмыванием денег. Обнаружение подозрительной активности похоже на попытку поразить движущуюся цель. Команды специалистов по обработке и анализу данных должны действовать быстро и выявлять высокоприоритетные подозрительные действия, не гоняясь за ложными срабатываниями. А поскольку финансовые услуги — это строго регулируемая отрасль, объяснения должны быть полностью прозрачными, чтобы их можно было легко объяснить регулирующим органам и заинтересованным сторонам.
Используйте DataRobot, чтобы ускорить процесс в геометрической прогрессии, уменьшить количество ложных срабатываний и автоматически создавать отчеты о соответствии, экономя часы ручной работы специалистов по данным. На нашем вебинаре, Как улучшить программы по борьбе с отмыванием денег с помощью автоматизированного машинного обученияя глубоко погружаюсь в то, как финансовые организации могут использовать DataRobot для победы над отмывателями денег.
Создание внутренней платформы искусственного интеллекта DataRobot
Начните с выбора источника данных. Как только вы войдете в каталог AI, вы увидите все таблицы, к которым вы уже подключены. Здесь мы используем Google BigQuery.
Однако сначала давайте посмотрим на данные. В этом примере набора данных мы видим исторические данные, которые мы использовали для обучения наших моделей. Мы видим, что некоторое время назад были сгенерированы оповещения, каждое из которых могло иметь или не иметь отчет о подозрительной активности (SAR). Здесь также есть много других контекстуальных данных — оценка риска клиента, дата, общие расходы и даже заметки колл-центра (текстовые данные).
Далее мы создаем проект моделирования.
Помните, что у меня три цели:
- Ускорить процесс выявления проблемных транзакций. (Скорость)
- Будьте более точны в выявлении подозрительной активности. (Качество)
- Объясните и задокументируйте каждый шаг. (Прозрачность)
Как только вы введете данные, DataRobot спросит вас, что вы хотите предсказать. Мы выбираем SAR, и DataRobot сначала покажет вам быстрое распределение SAR в ваших данных. Он говорит вам, что именно так выглядит ваша цель.
Вторичные наборы данных. В дополнение к основному набору данных DataRobot может легко автоматически подключаться к новым наборам данных, которые могут обогатить обучающие данные. DataRobot автоматически объединяет все входные наборы данных и генерирует новые функции которые могут повысить точность модели.
DataRobot также автоматически выявит любые проблемы с качеством данных — выбросы, выбросы, слишком много нулей, любые потенциальные проблемы — чтобы вы не отставали от качества по мере ускорения процесса моделирования.
Как только вы нажмете на Начинать Кнопка DataRobot инициирует процесс быстрого экспериментирования — экспериментирование с разработкой функций и статистикой обогащения данных. Начнется обучение сотен моделей в поисках лучшей модели, модели-чемпиона, которая даст наилучшие шансы на успех. На этом этапе вам предоставляется новая информация, в том числе о том, насколько важна функция ввода для нашей цели, ранжированная в порядке важности.
Вы также увидите новые функции, которых не было в исходном первичном наборе данных. Это означает, что DataRobot нашел ценность во вторичном наборе данных и автоматически сгенерировал новые функции для всех наших входных данных.
Чтобы быть полностью прозрачным в этой жестко регулируемой отрасли, вы можете щелкнуть и посмотреть на родословную функций. Это вернет вас к тому, откуда была взята каждая функция и какие преобразования были сделаны. Для любой новой функции вы можете просмотреть происхождение и объяснить, как эта функция была создана.
Скорость
Мы быстро получили чемпионскую модель, но нам нужно проверить качество и прозрачность модели. Детализируя его, мы можем увидеть, какие алгоритмы и методы использовались. Он также показывает все шаги, которые были предприняты на этом пути. Вы можете дополнительно настроить нужные параметры и сравнить их с исходной моделью.
Оцените качество
Насколько хороша или плоха эта модель в предсказании результата? Вы можете нажать на Оценивать чтобы посмотреть на кривую ROC или график подъема. Это момент, когда вы решаете, каков порог подозрительной активности. Не думайте об этом только с точки зрения науки о данных. Помните, для чего модель будет использоваться в контексте бизнеса, поэтому помните о затратах и преимуществах каждого результата для бизнеса. Когда вы в интерактивном режиме тестируете различные пороговые значения, числа в матрице путаницы меняются в режиме реального времени, и вы можете узнать у компании стоимость, которую они присваивают ложному срабатыванию, чтобы помочь определить оптимальный порог.
Прозрачность
Как уже отмечалось, в строго регулируемой отрасли прозрачность имеет первостепенное значение. Нажмите на Понимать кнопка. Влияние функции может сказать вам, какие функции оказывают наибольшее влияние на точность модели и что на самом деле влияет на поведение. Возможно, вы используете эту информацию, чтобы понять поведение клиентов и улучшить свой показатель KYC (оценка «Знай своего клиента»). Возможно, вы используете его для улучшения процессов, например, задавая клиентам правильные вопросы, когда они открывают счет.
Вы также можете изучить, как входные данные модели могут изменить выходные данные. Идти к Эффекты функций где вы можете проверить, как изменяется вывод модели при изменении одного конкретного параметра. Это позволяет вам смотреть на слепую зону модели.
Объяснимость. До сих пор вы могли видеть эффекты одной функции, но в реальной жизни ваша модель будет управляться несколькими функциями одновременно. Если вы хотите понять, почему был сделан один прогноз, вы можете увидеть все переменные, влияющие на прогноз, в виде комбинации. Насколько каждая из этих переменных повлияла на результат?
Поскольку это вариант использования для регулируемой отрасли, вам необходимо задокументировать все это для вашей группы соответствия. Под Согласие на вкладке, одним нажатием кнопки он автоматически создаст 60-страничный отчет о соответствии, в котором будут отражены все предположения, этапы разработки функций, вторичные таблицы и все, что было сделано для получения окончательной модели.
Это простой документ Word, который сэкономит вам много часов работы по обеспечению соответствия, если вы работаете специалистом по данным в регулируемой отрасли.
Предсказывать вкладка Вариантов развертывания модели очень много. Одним щелчком мыши я могу развернуть его на сервере прогнозов, а затем он будет добавлен на панель инструментов MLOps, которую вы можете увидеть в разделе Развертывания вкладка
Независимо от того, насколько хороша была ваша модель, когда вы ее обучали, со временем она будет ухудшаться. Данные и внешние факторы изменятся. Бизнес меняется. Вы захотите следить за своей моделью с течением времени. Вверху я вижу, как работают все мои развернутые модели с точки зрения дрейфа данных, точности и даже работоспособности службы. Изменились ли факторы риска? Как мои модели ведут себя в долгосрочной перспективе?
Я также вижу, где были развернуты эти модели. Модели можно создавать и размещать в другом месте, но ими по-прежнему можно управлять и отслеживать их на этой панели. DataRobot — это центр управления и управления всеми моделями, а не только моделями, созданными в DataRobot.
DataRobot автоматически обеспечивает скорость, качество и прозрачность
Чтобы опережать отмывание денег, финансовым учреждениям нужны функции, которые предлагает DataRobot:
- Автоматизированная разработка функций берет на себя утомительные ручные процессы.
- Быстрое экспериментирование позволяет настраивать модели и вносить дополнительные улучшения.
- удобный интерфейс позволяет быстро решать проблемы и находить белые пятна.
- Оценка качества данных помогает вам понять, насколько здоровы ваши данные, что является ключевым показателем в строго регулируемых отраслях.
- Порог интерактивной модели позволяет установить правильные пороговые значения для вашего бизнеса. Он проверяет наличие ложных срабатываний и отрицательных результатов и показывает, как это влияет на бизнес, тем самым обеспечивая качество модели.
- Автоматизированный мониторинг и переобучение позволяет поддерживать качество вашей модели.
- Происхождение функций, объяснимость и автоматизированная документация по соответствию является обязательным для обеспечения прозрачности в сфере финансовых услуг, и DataRobot делает это автоматически.
Об авторе
Мэй Масуд — специалист по обработке и анализу данных, сторонник ИИ и идейный лидер, обученный классической статистике и современному машинному обучению. В DataRobot она разрабатывает рыночную стратегию для платформы ИИ DataRobot, помогая глобальным организациям получать измеримую отдачу от инвестиций в ИИ, сохраняя при этом корпоративное управление и этику.
Мэй разработала свою техническую базу, получив степень в области статистики и экономики, а затем степень магистра бизнес-аналитики в Школе бизнеса им. Шулиха. Этот коктейль технического и бизнес-опыта сформировал Мэя как специалиста по искусственному интеллекту и идейного лидера. Мэй проводит основные доклады и семинары по этичному ИИ и демократизации ИИ для деловых и академических сообществ.
Познакомьтесь с Мэй Масуд