Банки десятилетиями использовали модели кредитного скоринга и управляли справедливыми кредитными рисками, связанными с этими моделями, с помощью долгосрочных программ соблюдения требований, основанных на нормативных указаниях¹ и частом надзоре. Однако за последние несколько лет растущий хор голосов выразил серьезную озабоченность справедливостью, присущей решениям о кредитах, основанным на алгоритмах, вплоть до того, что назвал использование таких алгоритмов робо-дискриминацией.

Поскольку кредитные рейтинги и автоматизированные модели андеррайтинга ответственно использовались в течение десятилетий, законно спросить: «Что изменилось?» в сегодняшней среде, которая вызывает это повышенное внимание и беспокойство. Рассматривая текущую отраслевую и нормативно-правовую среду, начинает вырисовываться картина, основанная на сближении следующих пяти сил, чтобы изменить популярное представление о справедливости кредитования на основе алгоритмов:

  1. Растущая замена традиционных методологий кредитной модели гораздо более продвинутыми, но гораздо менее прозрачными алгоритмами AI/ML.
  2. Растущая доступность и использование «альтернативных данных», то есть обширных финансовых и нефинансовых данных на уровне потребителей, агрегированных третьими сторонами и используемых для расширения набора потенциальных прогнозных сигналов для моделирования потребительского кредита, особенно финтех-компаниями.
  3. Новая, более агрессивная среда защиты прав потребителей на федеральном уровне и уровне штата, ориентированная на более справедливый доступ к кредитам, дополненная кадрами некоммерческих организаций, ученых и исследователей из технологических компаний, предлагающих исследования того, как предвзятые данные, предвзятые алгоритмы, предвзятые разработчики и/или предвзятые результаты модели препятствуют такому доступу и, следовательно, требуют «устранения предвзятости» моделей кредита на основе алгоритмов с помощью новых аналитических подходов (например, «использование ИИ для устранения предвзятости ИИ»).
  4. Рост финтех-компаний и соответствующие войны очков, в которых новые стартапы на базе ИИ сражаются за долю рынка выдачи потребительских кредитов с помощью стратегии связей с общественностью, подчеркивающей превосходную точность и справедливость их кредитных моделей по сравнению с традиционными методами. оценка кредитного риска.
  5. Появление сторонних стартапов в области искусственного интеллекта, предоставляющих потребительским кредиторам услуги «устранения предвзятости», чтобы снизить несоизмеримый риск воздействия их кредитных моделей.

Итак, что должен делать сотрудник по контролю за соблюдением нормативных требований в этой новой среде? Их существующие программы соблюдения справедливого кредитования больше не эффективны в сегодняшнем новом мире, основанном на искусственном интеллекте и машинном обучении? И если нет, то как должны развиваться их программы соответствия?

В то время как рынок заполнен академическими и коммерческими сообщениями о предвзятости кредитной модели и потенциальных решениях для соблюдения требований, в сообществе потребительских банковских услуг все еще существует определенная степень беспокойства по поводу принятия и развертывания этих решений (и соответствующих алгоритмов), не зная мнения их основных финансовый регулятор. На сегодняшний день эти регулирующие органы хранят относительное молчание, если не считать деятельности по сбору информации, повторения существующих нормативных требований и руководств, а также заявлений об общей обеспокоенности потенциальными рисками таких алгоритмов².

Поскольку регулирующие органы отстают от рынка, существует значительная степень неопределенности, омрачающая регулятивную среду, что препятствует инновациям многих банков и внедрению алгоритмов кредитного скоринга на основе AI / ML, которые могут снизить убытки, расширить доступ к финансам и уменьшить кредитное неравенство. Ниже я выделяю шесть наиболее важных открытых вопросов, связанных с предвзятостью ИИ, по которым потребительские кредиторы нуждаются в нормативном руководстве, чтобы способствовать дальнейшим финансовым инновациям.

1. Как следует измерять смещение модели?

Большинство кредитных моделей предназначены для прогнозирования относительной вероятности того, что заявитель станет серьезно просроченным или дефолтным в течение определенного периода времени после выдачи кредита, например, в течение 12 или 24 месяцев. Эта относительная вероятность выражается числовым баллом, откалиброванным по определенному диапазону, например, 300–850, где более высокие баллы соответствуют более высокому кредитоспособности заявителя, и наоборот. Кредиторы обычно применяют пороговое значение — или балльную оценку «отсечения» — на основе своей кредитной политики, чтобы определить подмножество заявок, которые могут быть одобрены. Конечно, существуют и другие соответствующие кредитные политики, которые также влияют на окончательное решение о кредите, такие как платежеспособность и, где это уместно, рассмотрение залога, поэтому наличие проходного балла не гарантирует одобрение кредита. Тем не менее, это важный первый шаг в общем процессе утверждения.

С учетом этой более широкой картины процесса принятия решения о кредите возникает важный вопрос: как следует оценивать предвзятость кредитной модели?

Одна из популярных в настоящее время мер погрешности называется Коэффициент неблагоприятного воздействия (AIR), который измеряет относительные уровни одобрения защищенных и незащищенных заявителей — при условии определенного порогового значения. По сути, AIR просто отражает, есть ли равенство результатов между группами, то есть, одобрены ли защищенные группы классов с той же скоростью, что и незащищенные группы классов. Если у них более низкий показатель одобрения, то AIR будет меньше единицы, и наоборот. Некоторые сторонники метрики смещения AIR предполагают, что значение AIR менее 0,80 представляет собой проблематичную погрешность модели (несоизмеримое влияние), и ссылаются на правило четырех пятых EEOC в качестве поддержки этого порога.³

В то время как AIR может со смыслом служить общим разрозненным индикатором риска воздействия, это странная мера предвзятости кредитной модели, поскольку она учитывает только прогнозы кредитной модели, а не ее точность. Например, если модель предсказывает более высокую ожидаемую частоту невыполнения обязательств для группы защищенного класса (например, 5%) по сравнению с группой незащищенного класса (например, 3,5%), и эти относительные прогнозы приводят к: (1) более низкому одобрению ставки для группы защищенного класса и, следовательно, (2) AIR, который падает ниже порога 0,80, почему точность этих прогнозов по умолчанию не имеет отношения к разрозненной оценке риска воздействия? В более общем плане, если я оценю точность прогнозов кредитной модели по всем демографическим группам и не найду доказательств предвзятости прогнозов для какой-либо демографической группы, не должен ли этот факт смягчить опасения по поводу справедливого кредитования, вызванные несоответствием AIR, путем предоставления законного бизнес-обоснования?

Не обязательно, согласно текущим отраслевым представлениям — и именно здесь крайне необходимы нормативные рекомендации.

Некоторые сторонники устранения предвзятости ИИ утверждают, что экономическое обоснование предполагает отсутствие менее дискриминационных альтернатив (LDA), и, следовательно, поиск таких альтернатив следует выполнять, когда AIR падает ниже порога 0,80 — независимо от модели. точность. Принимая этот подход, сторонники, по сути, утверждают, что точность прогнозирования модели — как на совокупном, так и на демографически конкретном уровне — является недостаточной защитой от разрозненных утверждений о воздействии. В частности, их позиция заключается в том, что кредиторы должны рассматривать альтернативные конфигурации кредитных моделей, которые уменьшают прогнозируемые несоответствия результатов модели (и, таким образом, увеличивают AIR модели) — даже если такие альтернативные модели менее точны в прогнозах — хотя не дается указаний относительно того, где Ожидается, что на кривой компромисса между точностью прогнозирования и несоизмеримым воздействием окажется кредитор.

Справедливости ради, это не означает, что сторонники устранения предвзятости ИИ выступают за менее точные кредитные модели; тем не менее, они предполагают, что: (1) требуемый поиск менее дискриминационных альтернатив согласуется с их интерпретацией применимых антидискриминационных законов, и (2) кредиторы должны выявлять и рассматривать менее точные модели в рамках своей программы соблюдения принципов справедливого кредитования. Хотя эта пропаганда расширения доступа к финансам достойна восхищения, я отмечаю, что такой подход чреват непредвиденными последствиями. В частности, принятие менее дискриминационной альтернативной кредитной модели с меньшей точностью (но более справедливой) открывает перед кредитором потенциальные регуляторные проблемы, связанные с надежностью и надежностью, а также UDAAP. Как я уже говорил в другом месте, модификации внутренней структуры модели, необходимые для создания менее дискриминационной альтернативы, могут непреднамеренно поставить под угрозу концептуальную обоснованность, надежность и/или стабильность модели таким образом, что это несовместимо с рациональным управлением рисками модели. Что касается UDAAP, если менее дискриминационная альтернативная модель намеренно занижает будущие проценты дефолтов для групп клиентов защищенного класса, чтобы увеличить процент одобрений, и в результате неплатежи по кредитам выдаются по более высоким ставкам, чем предсказывает модель, то кредитор может подвергнуться критике. для одобрения кредитов, которые, как известно, клиенты, скорее всего, не погасят, тем самым нанося ущерб их кредитным отчетам и ограничивая их доступ к кредитам в будущем.

Как показало это обсуждение, в настоящее время существует значительная неопределенность в отношении того, как следует измерять «предвзятость» кредитной модели. С одной стороны, традиционные подходы предлагают измерять такое смещение путем сравнения относительной прогностической точности кредитной модели для групп заемщиков защищенного и незащищенного классов, в то время как — в качестве альтернативы — сторонники новых подходов устранения смещения ИИ предпочитают сравнение результатов модели. (например, утверждения кредита) между защищенными и незащищенными группами классов. Разница в этих двух подходах значительна, и последствия для уровней риска справедливого кредитования, программ соблюдения добросовестного кредитования и потенциальных регуляторных проблем в связи с непредвиденными последствиями (например, надежность и надежность кредитования, а также потенциальные требования UDAAP) делают эту область необходимой. официальное нормативное руководство.

2. Достаточно ли испытаний на ударную вязкость на уровне модели или необходимо также проводить испытания на переменном уровне?

Исторически сложилось так, что в традиционных моделях кредитного риска использовалось относительно управляемое количество прогностических переменных (например, ‹ 30), что делало оценку несоизмеримого воздействия на уровне переменных относительно простой и эффективной. Кроме того, до широкого внедрения демографических прокси-моделей несоизмеримое тестирование воздействия на уровне модели проводилось редко из-за невозможности сравнить фактические и прогнозируемые результаты модели по расе/этнической принадлежности или полу.

Тем не менее, с сегодняшней сильной зависимостью от демографических показателей, таких как BISG, для тестирования справедливого кредитования, не связанного с ипотекой, несопоставимое тестирование воздействия на уровне модели стало как возможным, так и более распространенным, хотя важные риски и ограничения присутствуют. При таком тестировании на уровне модели и с учетом того факта, что кредитные модели на основе алгоритмов, особенно те, которые основаны на альтернативных данных, могут содержать сотни, если не 1000+ прогностических переменных, возникает закономерный вопрос о том, могут ли несопоставимые испытание на удар по-прежнему необходимо. Аргументы против такого тестирования включают следующее:

  • Анализ переменного уровня не так прост в моделях AI/ML, как в более традиционных моделях кредитного риска, которые имеют линейную структуру модели. Это связано с тем, что большинство архитектур моделей AI/ML нарезают, измельчают и повторно объединяют исходные входные данные модели в более сложные, многомерные, детализированные прогностические функции. Соответственно, исходные входные данные на самом деле не являются непосредственными прогностическими свойствами модели; скорее, прямые прогностические функции модели создаются алгоритмом AI/ML с помощью «франкенштейновского» процесса, с помощью которого фрагменты нескольких входных данных извлекаются и объединяются вместе в набор нижестоящих прогностических атрибутов, которые, как считается, имеют сильные прогностические сигналы для объяснения наблюдаемые результаты потребительского кредита. Учитывая этот процесс, выполнение разрозненных испытаний на воздействие исходных входных данных, вероятно, не имеет смысла, поскольку они не влияют напрямую и независимо на окончательные прогнозируемые результаты модели.
  • Даже если бы мы могли полностью и точно извлечь все эти франкенштейновские функции из модели, сам размер набора функций — учитывая, что мы начинаем с базы из 100+ или 1000+ исходных входных данных — вероятно, оказывает такое несоизмеримое влияние на индивидуальном уровне. анализ трудоемкий и очень ресурсоемкий.
  • Логически, если общий анализ на уровне модели указывает на отсутствие несоизмеримого риска воздействия, трудно понять ценность дополнительного анализа на уровне переменных. То есть, даже если анализ на уровне переменных идентифицировал один или несколько потенциальных несоизмеримых рисков воздействия, тот факт, что такие риски, по-видимому, смягчаются на общем уровне модели (т. е. после объединения и исключения влияния всех прогнозирующих атрибутов модели ) может показаться, что результаты с переменным уровнем спорны. Конечно, в качестве альтернативы, если разрозненное тестирование воздействия на уровне модели действительно выявило потенциальный риск, то — потенциально — детализация на уровне переменных может быть полезна, чтобы помочь определить основные причины эффектов на уровне модели.

Тем не менее, есть разумные контраргументы в пользу полезности анализа переменных уровней:

  • Создание алгоритмом франкенштейновских прогностических функций, их неясность и неразрешимость — все это красные флажки, указывающие на то, что разработчики и пользователи действительно плохо понимают истинные движущие силы прогнозов модели. Такие прогностические функции могут очень хорошо представлять демографические прокси, тем самым придавая некоторую степень несопоставимости прогнозам модели.
  • Даже если прогнозы модели считаются очень точными — в совокупности и для отдельных демографических групп этот результат может быть связан с влиянием потенциальных демографических прокси. Например, модель может испытывать затруднения при объяснении более высокой наблюдаемой частоты дефолтов в группе защищенных классов, что приводит к систематическому занижению прогнозов таких дефолтов. В ответ алгоритм может создать сложную комбинацию исходных входных данных, чтобы закрыть этот пробел, тем самым непреднамеренно создав демографический прокси. Действительно, чем больше количество доступных входных данных, тем больше у алгоритма шансов найти сложные комбинации таких входных данных для создания прокси.

Согласно этим аргументам, тестирование на уровне переменных имеет решающее значение — даже при отсутствии общих несоответствий на уровне модели. Однако извлечение и анализ сложных прогностических функций алгоритма в настоящее время может быть невозможно с помощью существующих инструментов и, следовательно, может потребовать от компаний отказаться от преимуществ более сложных алгоритмов в обмен на более простые алгоритмы, поддающиеся такому анализу на переменных уровнях.

Кроме того, если потенциальные демографические прокси будут определены и исключены из алгоритма, результатом будет модель, которая систематически занижает показатели дефолта для защищенного класса. Хотя такой результат не ставит в невыгодное положение группы защищенного класса (и, по сути, улучшает коэффициент неблагоприятного воздействия), компании теперь могут быть подвержены потенциальным требованиям UDAAP, если (как предсказывает модель) утвержденные кредиты этой группе в конечном итоге не выполнятся по более высоким ставкам. чем предполагалось.

В общем, однозначного ответа на этот вопрос в настоящее время нет. Нормативно-правовое руководство крайне необходимо.

3. Что делает прогностический атрибут потенциальным прокси защищенного класса?

Цель тестирования несоизмеримого воздействия на переменном уровне состоит в том, чтобы выявить прогностические признаки, которые могут непреднамеренно служить прокси для запрещенных демографических данных клиентов, таких как раса/этническая принадлежность, пол или возраст. Как правило, такие функции идентифицируются путем расчета корреляций переменных модели с демографической принадлежностью клиентов. Например, если значения конкретного прогностического фактора «сильно коррелируют» с расой/этнической принадлежностью клиента или в высокой степени предсказывают ее, то этот прогностический фактор можно считать потенциальным демографическим прокси.

Хотя эта оценка может показаться простой, прямолинейной и интуитивно понятной, на самом деле это не так.

Почти во всех областях потребительского кредита мы обычно наблюдаем, что определенные группы защищенного класса демонстрируют более высокие исторические показатели дефолта по кредиту, чем соответствующие группы незащищенного класса. Например, мы можем наблюдать, что у латиноамериканцев исторический уровень дефолта по кредиту составляет 8%, в то время как у белых исторический уровень дефолта по кредиту составляет 5%. Предполагая одинаковое кредитное поведение для двух групп⁴, более высокий уровень дефолта латиноамериканцев отражает более низкое распределение кредитного качества латиноамериканцев по сравнению с белыми.

С математической точки зрения единственный способ, при котором мы можем получить распределительные различия в кредитном качестве на уровне группы, — это если одна или несколько переменных модели коррелируют с расой / этнической принадлежностью — например, у латиноамериканцев среднее отношение долга к доходу выше, чем у белых, или у латиноамериканцев более низкое среднее отношение долга к доходу. средний балл FICO, чем у белых. Итак, с одной стороны, нам нужны модельные переменные, которые коррелируют с расой/этнической принадлежностью, чтобы создать точную прогностическую модель, но, с другой стороны, такие переменные могут рассматриваться как демографические прокси, которые нарушают законы и правила справедливого кредитования.

Как специалист по контролю за соблюдением нормативных требований определяет разницу?

К сожалению, нет никаких нормативных указаний, помогающих в этом определении. Кто-то может предположить, что если прогностический атрибут имеет логическую причинно-следственную связь с кредитным поведением заемщика, то существует презумпция того, что этот атрибут не является косвенным, даже если существует повышенная корреляция с демографической принадлежностью клиента (т. Обоснование для бизнеса"). Тем не менее, другие могут возразить, что даже при такой причинно-следственной связи кредитор должен рассматривать менее дискриминационные альтернативы (даже если, как это ни парадоксально, такие менее коррелированные атрибуты будут давать менее точные прогнозы уровня дефолта защищенного класса, тем самым создавая риски заявление UDAAP, а также вопросы безопасности и надежности).

Без четких нормативных указаний относительно того, является ли демографически коррелированный атрибут законным прогностическим фактором или недопустимым демографическим показателем, кредиторы, скорее всего, примут более консервативный подход и чрезмерно исключат такие атрибуты из кредитных моделей, тем самым уменьшая предполагаемые преимущества технология и потенциальное смещение регулятивных рисков кредитора в сторону UDAAP и безопасности и надежности.

4. Какова конечная цель устранения предвзятости кредитной модели?

Ранее я писал о текущих процессах устранения предвзятости, в которых алгоритмы машинного обучения модифицируются для создания набора менее дискриминационных альтернативных моделей кредитного риска, которые имеют различные комбинации прогностической точности и несоизмеримого воздействия. В том посте я пишу:

«… важно отметить, что в процессе устранения смещения альтернативные алгоритмы создаются путем: (1) удаления определенных предикторов из исходной обученной модели, (2) добавления новых предикторов, (3) изменения весов существующих предикторов, и/или (4) изменение гиперпараметров алгоритма AI/ML для улучшения показателя справедливости. Соответственно, возможно, что некоторые альтернативы могут содержать новые предикторы, исключать исходные предикторы или изменять отношения направленности существующих предикторов неинтуитивным образом, чтобы улучшить показатель справедливости, тем самым ставя под угрозу концептуальную надежность модели без смещения и повышение риска безопасности и надежности кредитора».

Главное здесь заключается в том, что не может быть «бесплатного обеда», когда речь идет об улучшении справедливости кредитной модели — даже если снижение точности прогнозирования считается незначительным и приемлемым — после включения в оценку других соответствующих свойств модели. Например, я отмечаю, что некоторые популярные процессы устранения предвзятости достигают уменьшения разрозненного воздействия за счет фундаментального изменения набора прогностических взаимосвязей, которые определяют оценки модели кредитного качества заемщика. Однако не налагается никаких ограничений на то, насколько «радикальными» могут быть такие изменения и считаются ли измененные отношения концептуально обоснованными, т. е. соответствующими бизнес-интуиции, применимым бизнес-политикам и практикам и известному поведению заемщика.

Соответственно, текущие процессы устранения предвзятости могут не отфильтровывать те менее дискриминационные альтернативные конфигурации моделей, которые могут вызывать опасения по поводу безопасности и надежности у валидаторов моделей и регулятивных экспертов и, соответственно, могут предоставлять кредиторам неполную информацию для оценки жизнеспособных моделей LDA. Учитывая важную взаимозависимость соображений справедливости и безопасности и надежности, присущих кредитным моделям, это представляет собой критическую область, в которой CFPB и применимый регулятор безопасности и надежности должны быть согласованы.

5. Можно ли использовать демографические данные для устранения разрозненных воздействий без нарушения ECOA?

Текущие подходы к устранению смещения модели обычно принимают следующие формы:

  • Увеличение обучающих данных — например, придание веса наблюдениям данных защищенного класса более сильному весу, чем наблюдениям данных незащищенного класса во время обучения модели, чтобы лучше сбалансировать демографическую репрезентативность, или изменение фактических результатов кредитного дефолта для защищенного класса и незащищенного класса. - защищенные члены выборки класса перед обучением модели, чтобы лучше демографически сбалансировать результаты кредитной деятельности, на которые откалиброван алгоритм.
  • Увеличение функции потерь модели. Например, вместо калибровки параметров модели для оптимизации только одной цели обучения модели (то есть точности прогнозирования) функция потерь модели увеличивается, так что параметры модели выбираются для оптимизации двойная цель (то есть точность прогнозирования и справедливость модели).
  • Итеративный поиск модели. Например, большой набор потенциальных моделей генерируется путем итеративной оценки моделей, содержащих различные подмножества исходных входных данных, или на основе различных гиперпараметров, специфичных для алгоритма. После того, как каждая потенциальная модель оценена, она оценивается на точность прогнозирования и справедливость. После завершения всех итераций потенциальные модели ранжируются по прогностической точности и справедливости, и кредитор выбирает конкретную конфигурацию модели из этого ранжирования.

Важнейшей особенностью всех подходов к устранению предвзятости является то, что демографические данные прямо или косвенно используются в процессе разработки модели, что вызывает опасения, что такое использование нарушает законы и правила справедливого кредитования. По сути, посредством процесса устранения предвзятости кредиторы переносят свой справедливый риск кредитования с несопоставимого воздействия на несопоставимое отношение. Этот риск более заметен для подходов устранения смещения, в которых демографические данные используются непосредственно в процессе разработки модели, таких как расширение обучающих данных и расширение функции потерь модели. В качестве альтернативы, при подходе итеративного поиска модели демографические данные используются только косвенно для оценки достоверности каждой потенциальной модели после оценки, что, по-видимому, значительно снижает разрозненность лечения. Тем не менее, ни один из основных финансовых регуляторов не прокомментировал эти альтернативные подходы — молчание, которое создало значительную нормативную неопределенность для сотрудников по соблюдению нормативных требований и потребительских кредиторов, стремящихся разработать алгоритмы с улучшенным финансовым доступом и справедливостью.

6. Как далеко должен зайти кредитор в исследовании «менее дискриминационных альтернативных» моделей?

Как обсуждалось выше, сторонники устранения предвзятости моделей рассматривают кредитные алгоритмы как «политику», оказывающую несоизмеримое влияние, и, следовательно, выступают за то, чтобы кредиторы искали менее дискриминационные альтернативные модели, даже если есть аргументы и доказательства в поддержку деловой необходимости алгоритма. оправдание. К сожалению, никаких ограничений или ограничений для этого поиска предложено не было, и неясно, сколько ресурсов, времени и усилий требуется для поиска этих потенциальных LDA.

Например, предположим, что кредитор разрабатывает новую модель кредитного скоринга AI/ML, используя логистическую регрессию и 20 атрибутов линейного прогнозирования. Во время тестирования справедливого кредитования AIR модели для афроамериканцев и белых заявителей составляет 0,75, что указывает на то, что ожидаемый уровень одобрения для афроамериканцев на 25% ниже, чем ожидаемый уровень одобрения для белых. Несмотря на это значение AIR, общая прогностическая точность модели высока, а прогностическая точность на групповом уровне одинакова как для афроамериканцев, так и для белых. Тем не менее,

  • Должен ли кредитор перебирать все возможные комбинации 20 прогностических атрибутов для LDA, то есть 1 048 576 различных моделей? Что, если есть 50 прогностических атрибутов и 1 125 900 000 000 000 различных комбинаций?
  • Должен ли кредитор включать в свой поиск все потенциальные взаимодействия атрибутов, даже если отношения исходной модели строго линейны? А как насчет других потенциальных функциональных форм?
  • Должен ли кредитор искать и учитывать дополнительные атрибуты данных за пределами исходного образца разработки модели? В этом примере, где выборка включает 20 прогностических атрибутов, ожидается ли, что кредитор будет искать дополнительные атрибуты для добавления к исходной выборке? Если да, то сколько поисков ожидается?
  • Должен ли кредитор исследовать дополнительные методологии моделей помимо логистической регрессии? То есть ожидается ли, что кредитор будет рассматривать модель случайного леса? модель дерева с градиентным усилением? Если да, то сколько различных типовых методологий предполагается использовать кредитору?
  • Сколько ожидается настройки/поиска гиперпараметров? Должен ли кредитор изучить все возможные конфигурации гиперпараметров?

Хотя сторонники устранения предвзятости, вероятно, скажут, что кредиторы должны проводить «разумный» поиск LDA, нет никаких указаний относительно того, что такое «разумный» в этом контексте. И что произойдет, если, несмотря на усилия кредитора, злоумышленник найдет альтернативную конфигурацию модели, демонстрирующую меньшую предвзятость? Здесь необходимы некоторые ограничения, которые помогут специалистам по контролю за соблюдением нормативных требований и кредиторам уменьшить неопределенность регулирования, связанную с предлагаемыми решениями по устранению предвзятости.

ПРИМЕЧАНИЯ:

[1] См., например, приложение к Бюллетеню рисков OCC 97–24 (Вопросы соответствия: ECOA (Положение B) и Закон о справедливом жилищном обеспечении) и приложение к Межведомственному документу FFIEC о справедливом кредитовании. Процедуры экспертизы» (Рассмотрение автоматизированного андеррайтинга и кредитного скоринга) — в качестве двух примеров.

[2] См., например, межведомственный запрос информации и комментариев по поводу использования финансовыми учреждениями искусственного интеллекта, включая машинное обучение» от 30 марта 2021 г., заявление CFPB от 26 мая 2022 г., подтверждающее требования о неблагоприятных действиях в равной степени применяются к кредитным моделям на основе ИИ, а также к сообщению в блоге CFPB от 15 декабря 2021 г., призывающему технических работников выступать в качестве осведомителей, если они … обладают подробным знанием алгоритмов и технологий, используемых компаниями, и… знают об потенциальная дискриминация или другие неправомерные действия в рамках полномочий CFPB.

[3] Я отмечаю, что использование порога AIR на уровне 0,80 официально не одобрено федеральными финансовыми регуляторами и, следовательно, вносит дополнительный уровень неопределенности в отношении измерения потенциальной систематической ошибки кредитной модели.

[4] Это допущение фактически требуется для того, чтобы модель соответствовала ECOA и другим применимым законам и правилам справедливого кредитования. То есть, если бы мы альтернативно предположили, что латиноамериканцы ведут себя иначе, чем белые, в отношении сходных характеристик, связанных с кредитом, таких как отношение долга к доходу, кредитный рейтинг и т. д., то такое предположение потребовало бы от нас явного рассмотрения расовая/этническая принадлежность клиента в архитектуре модели и/или во время использования модели. Однако это запрещено действующими законами и правилами о справедливом кредитовании.

© ООО Пейс Аналитика Консалтинг, 2022.