Машинное обучение и искусственный интеллект призваны преобразовать банковскую отрасль, используя огромные объемы данных для построения моделей, которые улучшают процесс принятия решений, адаптируют услуги и улучшают управление рисками.

Однако многие банки действуют осторожно, ограничивая использование моделей машинного обучения приложениями с низким уровнем риска, такими как цифровой маркетинг или улучшение операций бэк-офиса для сокращения затрат. Их осторожность понятна с учетом потенциальных финансовых, репутационных и нормативных рисков. В целом банки не решаются использовать передовые методы машинного обучения или использовать альтернативные данные для гарантирования ссуд или принятия решений о кредитовании в режиме реального времени. Традиционный подход использования кредитной истории для одобрения любых займов по-прежнему преобладает в отрасли. С другой стороны, такие финтех-компании, как Kabbage, Nova Credit и т. Д., Очень сильно продвинулись вперед, чтобы изменить статус-кво и подорвать кредитную отрасль за счет использования передовых моделей кредитных решений с машинным обучением и использования альтернативных данных для утверждения кредитов. Facebook объявляет о том, что платформа Libra для обмена криптовалютой при поддержке крупнейших финансовых технологий мира, не за горами, когда у миллениалов будет альтернативная кредитная линия от Libra, с одобрением займов на основе истории транзакций на Paypal, Venmo, и т. д. и деятельность электронной коммерции.

Что мешает банкам пойти по пути финтех? Риски моделей машинного обучения! Чтобы в полной мере воспользоваться преимуществами моделей машинного обучения и снизить риски, связанные с моделями машинного обучения, банкам потребуются политические решения по оценке надежности, рисков и ограничений моделей машинного обучения. Регулирующие органы не выпустили каких-либо конкретных руководящих принципов или инструкций о том, как это сделать, но вместо этого возлагают бремя на банки, чтобы обеспечить надлежащее управление рисками, связанными с моделями машинного обучения.

Но банки уже много лет традиционно используют статистическое моделирование во всех своих предложениях продуктов. А машинное обучение - это часть статистического моделирования (или наоборот - классическая проблема курицы и яйца!). Что в любом случае делает модели машинного обучения такими рискованными для них? Сложность модели! Модели машинного обучения обычно работают с гораздо большими наборами данных, включая неструктурированные данные, такие как естественный язык, изображения и речь. Алгоритмы, как правило, намного сложнее, чем их статистические аналоги, и часто требуют принятия проектных решений до начала процесса обучения. Кроме того, модели машинного обучения строятся с использованием новых пакетов программного обеспечения и вычислительной инфраструктуры, требующих более специализированных навыков.

Ведущие технологические компании, активно использующие машинное обучение в качестве своей операционной модели, начали придумывать различные модели управления рисками, стандарты и этические нормы для использования машинного обучения (или, по крайней мере, создается осведомленность). Банки могут извлечь пользу из такого управления машинным обучением и моделирования операционных структур, чтобы установить свою политику для устранения рисков, связанных со сложностью моделей машинного обучения. Такая политика может помочь ускорить внедрение инноваций в области прикладного машинного обучения в банковской сфере.

Ниже перечислены области, в которых необходимо разработать политику, чтобы снизить риски использования моделей машинного обучения в банковской сфере:

  1. Интерпретируемость. Модели машинного обучения имеют репутацию черных ящиков. В зависимости от архитектуры модели результаты, которые она генерирует, могут быть трудными для понимания или объяснения. К счастью, несмотря на репутацию «черного ящика» моделей машинного обучения, в последние годы был достигнут значительный прогресс в обеспечении интерпретируемости их результатов. В зависимости от класса модели можно использовать ряд подходов. Например, в нелинейных и немонотонных моделях, таких как модели неограниченного глубокого обучения, такие методы, как локальные интерпретируемые независимые от модели объяснения или значения Шепли, помогают обеспечить локальную интерпретируемость. Кроме того, теперь доступно множество инструментов для визуализации, интерпретации и отслеживания решений модели. Банки должны создать основу для оценки интерпретируемости модели и документировать любые известные ограничения и поведение.
  2. Предвзятость: очень вероятно, что предвзятость может быть внесена в любую модель - статистическую или машинное обучение. Эта систематическая ошибка может возникать из-за систематической ошибки в выборке и измерениях, систематической ошибки алгоритма и предвзятости в отношении групп или классов людей. Последние два типа, алгоритмическая предвзятость и предвзятость против людей, могут быть усилены в моделях машинного обучения. Чтобы устранить алгоритмическую предвзятость, процессы проверки модели должны быть обновлены, чтобы гарантировать, что соответствующие алгоритмы выбраны в любом заданном контексте. Другой подход - разработать модели «претендента» с использованием альтернативных алгоритмов для оценки производительности. Чтобы устранить предвзятое отношение к группам или классам людей, банки должны сначала решить, что составляет справедливость. Модели можно тестировать на предмет объективности и, при необходимости, корректировать на каждом этапе процесса разработки модели, от этапа проектирования до мониторинга производительности.
  3. Разработка функций. Разработка функций часто является более сложной задачей при разработке моделей машинного обучения, чем в традиционных моделях. Банки должны предоставить создателям моделей установленное руководство для определения уровня поддержки, необходимой для установления концептуальной надежности каждой функции, используемой в модели. Политика может отличаться в зависимости от области применения модели. В качестве отправной точки к политике можно исходить из следующих соображений - математического преобразования входных данных модели, критериев принятия решения для выбора функций и бизнес-обоснования.
  4. Гиперпараметры. Многие параметры моделей машинного обучения, называемые гиперпараметрами, такие как глубина деревьев в модели случайного леса или количество слоев в глубокой нейронной сети, должны быть определены до тренировочный процесс может начаться. Производительность модели и ее стабильность могут зависеть от выбранных гиперпараметров. Такой выбор гиперпараметров очень сложно сделать с точки зрения моделирования. Банки могут составить руководство по моделированию, в котором объясняются передовые методы настройки гиперпараметров. Лучшим подходом к выбору гиперпараметров для начала является сочетание экспертной оценки и, по возможности, новейших отраслевых практик. Кроме того, список утвержденных алгоритмов поиска по сетке и методов определения оптимальных гиперпараметров. Руководство по передовой практике также может помочь банкам установить последовательные и контролируемые методы, которым следуют все модели машинного обучения в их инвентаре моделей.
  5. Готовность к производству. Модели машинного обучения являются алгоритмическими и поэтому требуют дополнительных вычислений. Это требование обычно игнорируется в процессе разработки модели. Чтобы определить производственную пригодность модели, банки должны установить рамки оценки модели, основанные на оценке объема данных, которые будут проходить через модель, оценке архитектуры производственной системы (например, графических процессоров для глубокого обучения) и времени выполнения. обязательный.
  6. Калибровка динамической модели. Некоторые классы моделей машинного обучения динамически изменяют свои параметры, чтобы отражать возникающие закономерности в данных. Это заменяет традиционный подход периодического ручного обзора и обновления модели. Риск состоит в том, что без достаточного контроля чрезмерный упор на краткосрочные закономерности в данных может со временем навредить производительности модели. Поэтому банкам необходимо решить, когда разрешить динамическую перекалибровку. Они могут сделать вывод, что при наличии правильных элементов управления он подходит для некоторых приложений, таких как алгоритмическая торговля. Для других, таких как кредитные решения, они могут потребовать четких доказательств того, что динамическая повторная калибровка превосходит статические модели.

Банкам необходимо будет действовать постепенно, но быстро при формировании политики, чтобы идти в ногу с растущими инновациями в сфере финансовых технологий и постоянно развивающейся экосистемой машинного обучения. Со временем банки смогут создать среди разработчиков моделей уверенную среду, чтобы начать использовать всю мощь машинного обучения и внедрять инновации, тщательно снижая риски, связанные с использованием моделей машинного обучения.

PS. Взгляды и мнения, выраженные здесь, носят личный характер и никоим образом не отражают взгляды, практики или политику моего работодателя или каких-либо ассоциаций.

Оригинальная статья была опубликована на Linkedin:



Не стесняйтесь обращаться, если у вас есть какие-либо вопросы, комментарии или критические замечания или вы просто хотите обсудить жизнь.