Всем привет!

Мы, команда Advanced Analytics T1A, запускаем серию статей о моделировании в управлении кредитными рисками. Цель серии — дать краткую информацию о сфере, расширить профессиональный словарный запас и дать ссылки на полезные книги и статьи.

Мы надеемся, что это будет полезно для всех, кто только начинает свое путешествие по анализу кредитных рисков, или для менеджеров, связанных с рисками, которые хотят больше узнать о базовой математике.

Во вводной статье мы рассматриваем 6 исходных данных для моделирования рисков, оценки резервов и их значения, а также демонстрируем особенности применения ML & DS в управлении кредитными рисками, не углубляясь в предметную область. Вы лучше поймете определение риска, понимание кредитного конвейера, рассмотрите 6 исходных данных для моделирования рисков, оценки резервов и их значения.

Затем мы рассмотрим важные для банка вопросы методологии моделирования, обработки компонентов кредитного риска и подходов к калибровке и проверке.

Публикация основана на нашем опыте разработки и внедрения аналитических моделей в банковской сфере.

Итак, приступим к делу!

Чем мы рискуем?

Проще говоря, кредитный риск заключается в прогнозировании вероятности того, что клиенты нарушат свои кредитные соглашения.

Давайте сосредоточимся на следующих трех задачах, возникающих при управлении кредитным риском:

  1. Рейтинговое моделирование
  2. Кредитное предложение
  3. Расчет ожидаемых убытков

Почему мы беремся за эти три задачи?

  • Они всегда необходимы
  • Их достаточно легко перенести в другие отрасли (телекоммуникации, промышленность, страхование).
  • Есть много места для методов ML и DL

С общей классификацией рисков финансовых организаций и контекстом вы можете ознакомиться в обзоре [1].

Кредитный трубопровод

Схема оформления кредита следующая:

Приведенная выше схема упрощена. Например, обзор рабочего процесса ограничивается кредитным продуктом, оставляя в стороне маркетинговые вопросы, такие как оптимизация маркетинга, каннибализация продукта, отток клиентов и т. д. Этот пайплайн не содержит предварительный скоринг, корректировку экспертного рейтинга, применение стоп-факторов андеррайтерами. . Стоп-факторы подразумевают ограничения, связанные со структурой банковского продукта. Например, когда клиент находится в списке банкротов или имеется просрочка по кредитам, выданным другими банками.

Рейтинговое моделирование

Целью рейтингового моделирования является разработка модели рейтинга клиентов для дальнейшей категоризации. Рейтинг учитывает различные негативные события, такие как снижение кредитоспособности заемщика, банкротство и т.д.

У нас может быть 6 категорий и нумерация всех последующих разделов «на основе».

Мнение экспертов:

  1. Оценка приложений используется для новых клиентов и клиентов с короткой, древней или неактуальной историей в финансовом учреждении. Для разработки рейтинговой модели такого типа важно получить данные из профиля клиента и регистрационной формы, историю платежей из других финансовых учреждений, предоставленную кредитным бюро, а также информацию о том, был ли клиент включен в различные негативные списки. . Например, черная книга юридических лиц, которую ведет ЦБ. Оценка заявки используется для принятия решения о предоставлении кредита заявителю.
  2. Поведенческая оценка применяется для присвоения рейтинга клиентам с реальной историей. Ведущую роль для данной модели играют поведенческие атрибуты внутри банка, такие как оборот клиентов, платежная дисциплина по другим продуктам банка. Поведенческий скоринг используется для расчета и корректировки суммы зарезервированных средств, но о нем мы поговорим позже.

На основе требований к выходным данным модели:

  1. Относительный рейтинг. Качество категоризации или относительный порядок клиентов в рейтинге имеет решающее значение. Абсолютное значение не влияет на окончательное решение.
  2. Абсолютный рейтинг. Важным является абсолютное значение скоринга, а также алгоритм его пересчета в вероятность дефолта. Банки часто устанавливают порог вероятности дефолта, когда кредит может быть предоставлен клиенту, поэтому необходимо тщательно определить абсолютное значение вероятности дефолта для каждого клиента.

Основываясь на влиянии мнения экспертов на окончательное решение:

  1. Статистическая модель. Веса определяются на основе статистического анализа ретроспективных данных. Экспертные корректировки вносятся на этапах выбора признаков и пробоподготовки.
  2. Экспертная модель. Окончательные веса факторов устанавливаются вручную или полуавтоматически с учетом исторических случаев по умолчанию. Классическим примером является Z-оценка Альтмана. [2].

На основе уровня автоматизации процесса принятия решений:

  1. Присвоенный рейтинг автоматически передается по конвейеру без каких-либо ручных корректировок для большинства клиентов. Часть клиентов проходят ручную проверку в рамках онлайн-мониторинга работы модели.
  2. Присвоенный рейтинг служит дополнительным инструментом для владельца модели и для андеррайтера.

По уровню использования информации о внешней среде:

  1. Автономный подход. Факторы модели не учитывают взаимодействие клиента с другими покупателями. В основу положены поведенческие атрибуты по финансовым продуктам. Воздействие внешней среды учитывается либо через процедуру корректировки, либо через набор флажков негативной информации с другими клиентами без подробностей.
  2. Подход к финансированию цепочки поставок рассматривает информацию о связях клиента с другими заемщиками. В первую очередь учитывается история сделок, экономическая и/или юридическая принадлежность к другим клиентам или родственные связи физических лиц. Чем больше информации доступно, тем точнее прогноз (не только на уровне клиента, но и на уровне сделки [3]).

На основе уровня вовлеченности в общий рабочий процесс:

  1. Выходные данные рейтинговой модели используются локально. Задача, как правило, не интегрирована с другими процессами. Это может привести к дополнительным требованиям к поддержанию рейтинга, например, к корректировкам. Например, рейтинг компании корректируется в зависимости от уровня государственной поддержки.
  2. Выходные данные модели служат входными данными для следующего процесса, который является неотъемлемой частью более крупного приложения. Важно учитывать особенности этого внешнего процесса, так как он может повлиять на требования к разработке и валидации рейтинговой модели.

Обзор решения Общий обзор решения данной проблемы см. в [1], [4]. Подробности проекта мы расскажем в следующей статье цикла, посвященного методологии разработки.

Мы также отметим связанные с этим задачи, такие как предложение кредита, приведенное ниже, и определение порогового уровня на основе оценки, другими словами, как установить порог одобрения кредита. Последняя проблема не описывается в этой статье, но это потенциальная область применения передовых методов машинного обучения. Например, предпринимаются попытки использовать для этих целей RL-подход [7].

Кратко отметим также текущую тенденцию повышения качества разрабатываемых рейтинговых моделей:

  1. Поиск новой информации и/или источников данных. Например, геоаналитика [8], социальные сети, Оператор фискальных данных (ОФД).
  2. Использование передовых алгоритмов для целей моделирования. XGBoost все чаще заменяет стандартные системы показателей, основанные на логистической регрессии.
  3. Использование передовых алгоритмов для поиска взаимосвязей (анализ графов) и создания определенных атрибутов (анализ текста).
  4. Операционализация моделей, т. е. интеграция моделей в автоматический конвейер разработки-внедрения-мониторинга-переобучения для снижения рисков моделирования и автоматизации процессов, так называемые решения ModelOps.

Рейтинговое моделирование редко выделяется в отдельную задачу, оно все чаще рассматривается в комплексе с другими задачами как часть прикладного решения более общих задач (в том числе кредитного предложения). Итак, приступим к кредитному предложению.

Предложение кредита или как сделать предложение, от которого невозможно отказаться

Выходные данные рейтинговой модели, то есть абсолютное значение вероятности дефолта (PD), могут быть использованы для решения проблемы предложения кредита. В первую очередь под кредитным предложением подразумевается задача установить первоначальный лимит для клиента.

Конечно, одного значения PD, то есть прогноза вероятности дефолта, недостаточно для определения оптимального предела. Важно видеть допустимый лимит домена, чтобы сделать разумное предложение клиентам. Сумма должна как минимум косвенно отражать потребности клиентов и способность обслуживать долг.

Ориентиром может служить оборот собственных средств клиента по некредитным продуктам.

Что еще мы должны знать? Стоимость структуры кредита помогает лучше понять задачу. Схема структуры стоимости кредита представлена ​​ниже:

«Ресурс» — это стоимость денег, используемых для предоставления кредита, например, депозитная ставка, которая привлекает инвесторов и обеспечивает требуемую денежную массу, а «Маржа» — это ожидаемая доходность по кредиту. «Риск» — это вычет за дефолт заемщика. «Расходы» означают затраты на приобретение и обслуживание.

В приведенной выше структуре моделирование рейтинга может быть применено для определения размера и структуры полосы «Риск». «Ресурс» во многом зависит от ключевой ставки ЦБ. «Расходы» и «маржа» являются составляющими продукта и часто определяются в паспорте продукта. Другими словами, «Риск» — это лишь одна из составляющих, влияющих на итоговую доходность сделки.

Что можно сделать с другими компонентами? Похоже на новую задачу оптимизации. Попробуем его оформить. Важно отметить, что вариантов может быть несколько, и в первую очередь мы будем руководствоваться бизнес-задачей и контекстом процесса разработки.

Начнем с простого сценария, а затем покажем возможные точки развития решения. Самая простая задача — оптимизировать прибыльность сделки.

Предположим, что сумма кредитного договора равна L (лимит). Это соглашение имеет прогнозируемую вероятность дефолта PD. Долг клиента составляет L на момент дефолта.

Тогда задача оптимизации выглядит следующим образом:

Мы видим, что PD фиксирована и имеет линейную зависимость от L. Можно возразить, что оптимизировать нечего.

Однако в реальной жизни PD зависит от L из следующих соображений: чем выше лимит, тем сложнее обслуживать долг и, следовательно, выше вероятность дефолта. В данном конкретном случае, действительно, перед нами стоит оптимизационная задача. Однако есть некоторые тонкости. В выборку включены клиенты с разным доходом, поэтому недостаточно брать только абсолютные значения. Зависимости лучше строить исходя не из лимита, а из уровня долговой нагрузки, т.е. параметра Доход клиента (Iк) к

Зависимость PD (L / Ic) можно узнать из исторических или экспериментальных данных.

На задачу оптимизации также могут повлиять остановки продукта. Например, допустимый уровень риска или вероятность невыполнения обязательств может быть установлен в техническом паспорте продукта. Затем производится оптимизация в заданных пределах.

Для получения дополнительной информации вы можете погуглить следующие ключевые слова: лимит на основе риска, подход к управлению кредитным лимитом, основанный на прибыли.

Деньги были предложены, и кредиты были предоставлены клиентам. Некоторые кредиты просрочены. Как мы можем справиться с этой проблемой? Мы делаем наличные резервы в качестве подушки безопасности.

Запасы и роль DS в подсчете запасов

И где резервы?

Определение риска является ключевой задачей любого банка. Банк решает, готов он работать с клиентом или нет, в зависимости от аппетита к риску. В любом случае банк должен формировать соответствующие резервы из денежных средств или ликвидных ценных бумаг, чтобы минимизировать возможные потери. В худшем случае банк потеряет весь портфель, хотя это маловероятно, поэтому иметь полные резервы нецелесообразно. Требуется минимальный баланс.

Во-первых, необходимо определить сумму денег, которую необходимо зарезервировать. Таким образом, перед нами стоит задача обеспечить необходимый капитал для покрытия ожидаемых убытков (EL).

Историческое примечание:

Убытки в долларах являются произведением трех составляющих:

  1. Вероятность дефолта (PD)
  2. Риск при дефолте (EAD) — это сумма долга заемщика на момент дефолта.
  3. Убыток при дефолте (LGD) — это доля этой суммы, которая остается невыплаченной.

С приведенной выше формулой мы встретимся далее в серии статей, так как это рефрен проблемы резервирования в управлении кредитным риском.

При такой декомпозиции ожидаемых убытков (EL или ECL) можно смоделировать каждую из вышеперечисленных переменных, а именно PD с помощью модели бинарной классификации, LGD с помощью регрессионной модели, EAD с помощью регрессионной модели. Таким образом, на различных этапах моделирования (калибровка и валидация) можно использовать методы науки о данных и алгоритмы машинного обучения. Привет ДС и МЛ!

Для тех из вас, кто любит сложные задачи:

Спецификации и руководства остаются позади, а книги читаются. Так где же ДС? Как мы и обещали, DS — это детализированные компоненты, но это совсем другая история! Особенности моделирования компонентов PD, LGD и EAD будут подробно рассмотрены в следующей статье цикла. В конце вводной статьи приведем таблицу со статистическими методами и вариантами применения машинного обучения в разбивке по задачам управления рисками.

Вывод

Написав вступительную статью, мы, авторы, пришли к следующему выводу: очень сложно вкратце рассказать даже о трех задачах, возникающих при расчете кредитного риска. Почему?

Для этих задач существует тщательно проработанная методология, которая подкрепляет идеи приложений ML & DS. Эти идеи развивают подходы, чтобы дать актуальный ответ на усложняющиеся рыночные вызовы. Инструменты, основанные на таких подходах, превращаются из дополнительных методов в жизненно важные инструменты для принятия решений. Сочетание всех этих факторов позволяет нам использовать передовой опыт и идеи моделирования рисков в других отраслях, таких как телекоммуникации, страхование и промышленность. Подробности скоро в следующих статьях цикла.

Что вы думаете о нашем подходе? Поделитесь своими комментариями ниже!

Глоссарий

  • Дефолт — неисполнение обязательств по кредитному договору. Обычно по умолчанию считается просрочка 90 дней.
  • PD означает вероятность дефолта.
  • EAD означает подверженность риску по умолчанию. Сумма кредитных обязательств по договору на дату дефолта. По сути, это остаток на счете на дату дефолта, где остаток = основная сумма + начисленные проценты + начисленные комиссии.
  • LGDобозначаетубыток при дефолте. Это доля EAD, которую клиент не может вернуть на горизонте восстановления.
  • EL означает ожидаемый убыток по соглашению.
  • ОКУ означает ожидаемый кредитный убыток, т. е. ожидаемый убыток по соглашению в течение всего срока его действия.
  • Андеррайтер — сотрудник, отвечающий за оценку рисков и принятие окончательного решения по кредитной заявке.
  • Стоп-фактор – это ограничение, которое не позволяет банкам предоставлять клиентам кредитные продукты.
  • SCF расшифровывается как финансирование цепочки поставок. Это система взаимодействия между поставщиком и его контрагентами.
  • RWA означает активы, взвешенные с учетом риска, и используется для оценки достаточности капитала.
  • IRB означает внутренний рейтинговый подход к кредитному риску банка, используемый для оценки регулятивного коэффициента достаточности капитала, который основан на внутренних рейтингах заемщиков, т.е. рейтингах, установленных банком.
  • МСФО 9обозначает международный стандарт финансовой отчетности, который наряду с другими положениями также подразумевает оценку ожидаемых кредитных убытков с поправкой на срок действия договора и стадии обесценения.
  • VaR означает стоимость под угрозой. Это сумма, которая с заданной вероятностью не будет превышена убытками в течение определенного периода времени.