Плата за уход может быть стрессовой.

В момент, когда пациенты наиболее уязвимы, они должны пройти сложный процесс оплаты. Стресс еще больше усугубляется, когда счет превышает их платежеспособность — даже при наличии плана платежей.

Но что, если счет может быть снижен в соответствии с финансовым положением человека, гарантируя при этом оплату поставщику услуг за оказанные услуги?

В Cedar мы обнаружили, что, если поставщики предлагают скидки пациентам, когда они уведомлены о счете (по сравнению с тем, когда они звонят), это увеличивает вероятность того, что пациенты оплатят свои счета без уменьшения общей суммы, выплачиваемой поставщику. Это беспроигрышный вариант для обеих сторон.

Наши данные показывают, что скидки работают лучше всего, когда у пациентов есть возможность применить скидку к плану оплаты, доведя свой ежемесячный платеж до управляемого (и индивидуального) уровня. Но как определить, какие пациенты должны получать скидки? Мы узнали, что существует множество факторов, влияющих на вероятность оплаты пациентом, и что это сложная проблема, для решения которой особенно хорошо подходит машинное обучение (МО).

Когда мы начинали работу по дисконтированию, мы знали, что важно будет помочь тем пациентам, которые в этом больше всего нуждаются, о чем говорилось в нашей предыдущей статье. В конечном итоге мы разработали решение для машинного обучения, которое увеличило сборы, определив, в каких случаях следует предоставлять скидки. С помощью нашего решения для машинного обучения мы предоставляем значительно больше скидок пациентам с более крупными счетами: около 86% счетов на сумму 800 долларов США и выше предоставляются скидки, и только 12% счетов менее 800 долларов США предоставляются скидки. Мы также видим, что пациенты с предполагаемым доходом менее 50 000 долларов США (исходя из медианного дохода для их почтового индекса) с большей вероятностью получат скидку, чем пациенты, чей предполагаемый доход превышает 50 000 долларов США. Проанализировав, кто получает скидку, мы можем подтвердить, что наша модель машинного обучения является справедливой, равноправной и имеет значение там, где это важнее всего.

В этой статье я расскажу, как мы подошли к этой задаче, чтобы приблизиться к нашей миссии по повышению доступности здравоохранения за счет скидок на основе машинного обучения, и чему мы научились на этом пути.

Модель машинного обучения стала возможной благодаря многолетним экспериментам

В течение последних нескольких лет мы собирали данные о том, как скидки могут повлиять на результаты оплаты. В 2020 году мы начали эксперимент, в ходе которого мы случайным образом назначали пациентам скидку 15%, 30%, 45% или отсутствие скидки. Используя эти экспериментальные данные в качестве обучающего набора, мы построили модель машинного обучения склонности к оплате, которую можно использовать для прогнозирования вероятности того, что конкретный пациент оплатит свой счет, учитывая, что он получил определенную скидку. размер. Сравнивая ожидаемую стоимость коллекций между вариантами скидки, мы могли выбрать вариант скидки, подходящий для данного пациента.

Мы запустили нашу модель машинного обучения в начале 2022 года и с нетерпением ждали результатов — это заняло некоторое время, потому что результаты находятся на 120-дневных циклах. Показателем результата, который мы измеряли, является уровень сбора: сумма, собранная из общей первоначальной (до скидки) суммы, выставленной в счете.

Когда у нас было достаточно данных для оценки результатов, мы обнаружили, что группа пациентов, отнесенных к модели ML, имела самый низкий уровень сбора по сравнению с группами пациентов, которым была предоставлена ​​одинаковая скидка (или отсутствие скидка). Увидев результаты, мы были разочарованы — но не побеждены! Системы машинного обучения очень сложны, и для их корректировки может потребоваться несколько итераций. Наша команда машинного обучения приступила к действиям, чтобы понять, почему наша модель оказалась неэффективной. Тщательно изучив различные аспекты системы, мы внесли три ключевых улучшения, которые, как мы предполагали, приведут к повышению производительности машинного обучения.

1. Улучшение обучающих данных

Те, у кого есть опыт работы с моделями машинного обучения, скорее всего, знакомы со следующей концепцией: качество вывода, создаваемого алгоритмом, сильно зависит от качества предоставленных ему входных данных. Это была одна важная область для исследования: были ли наши тренировочные данные на должном уровне?

Мы построили конвейеры агрегации данных (на деидентифицированной основе), которые реконструировали детали о каждом пациенте и счете, который они получили в прошлый момент времени (точный момент, когда они получили скидку). Однако при ближайшем рассмотрении мы увидели, что данные включали информацию о событиях, произошедших после этого момента. Это распространенная ошибка моделей машинного обучения, известная как «утечка данных». Мы пересмотрели нашу логику расчета признаков, чтобы убедиться, что обучающие данные точно отражают момент времени, который они должны были зафиксировать, и что входные данные точно совпадают между обучающими данными и данными «вывода» (где вывод представляет собой момент, когда модель ML делает новый прогноз).

Мы также изучили атрибуты, которые использовались в качестве входных данных для модели склонности к оплате. Всего было 44 входа, многие из которых касались счетов пациентов, их посещений поставщика, наличия цифровых методов связи и их истории платежей. Однако наша автономная оценка модели показала, что мы можем добиться высокой производительности модели, используя всего 14 входных данных (комбинация некоторых исходных входных данных, а также новых, разработанных нами). Удалив ненужные входные данные, мы уменьшили тенденцию модели запоминать то, что она видит в обучающих данных (концепция, известная как переобучение), и вместо этого сосредоточились на более обобщенных шаблонах.

2. Учет долгосрочных результатов

Когда пациент получает счет, у него есть 120 дней, чтобы произвести платеж или начать план платежей. Таким образом, целевой переменной для нашей модели машинного обучения был платеж в течение этих 120 дней. Но когда мы углубились в собранные нами исторические данные, мы увидели кое-что интересное: скидки влияют на сборы после первых 120 дней, потому что планы платежей по более мелким счетам с большей вероятностью будут выполнены. Когда мы делаем скидку на счет, люди с меньшей вероятностью отменяют план оплаты, который они начали, что делает скидку еще более эффективной в долгосрочной перспективе. Мы не включили это явление в первую версию нашей модели, поэтому система машинного обучения редко давала скидки. Как только мы добавили эту корректировку, наша модель стала давать гораздо больше скидок, чем раньше.

3. Пересмотр архитектуры системы

Когда мы впервые запустили наш эксперимент со скидками, он был настроен таким образом, что каждому пациенту была назначена группа скидок — без скидки, 15 %, 30 % или 45 % — и затем он оставался в этой группе для всех будущих счетов, которые они могут выставлять. получить от провайдера. Сначала это работало хорошо, но когда мы добавили в эксперимент группу машинного обучения, возникла проблема: модель машинного обучения использовалась только для новых пациентов, потому что те, кто посещал ее ранее, уже были отнесены к группе скидок. Это было проблематично, потому что модель ML лучше всего работала на пациентах, у которых у нас было больше истории. В результате мы реструктурировали наш эксперимент таким образом, чтобы пациенты оставались в одной и той же дисконтной группе на протяжении всего расчетного цикла, а когда расчетный цикл заканчивался и начинался новый, они случайным образом распределялись в новую группу. Это гарантировало, что модель машинного обучения сможет делать то, что у нее получается лучше всего: делать точные прогнозы в ситуациях, когда ей предоставляется больше информации.

Момент истины

Мы запустили нашу обновленную модель машинного обучения в конце прошлого года, и теперь мы начинаем видеть первые результаты. Хотя еще недостаточное количество пациентов достигло 120-дневной отметки (момент, когда мы могли бы сделать окончательную оценку результата), мы можем провести раннюю оценку на 90-дневной отметке. Чтобы проанализировать результаты, мы используем технику, называемую самозагрузкой, которая позволяет нам сравнивать уровень собираемости по разным группам скидок.

По результатам 90-дневного периода мы заметили, что модель машинного обучения превосходит все другие группы скидок, создавая относительный рост собираемости почти на 10%! Это очень важно, потому что показывает, что, предлагая скидки пациентам, которые в них нуждаются, поставщики могут получить значительную финансовую выгоду, создавая беспроигрышную ситуацию для пациентов и поставщиков. Как уже говорилось, важно обеспечить, чтобы наша модель давала скидки тем группам пациентов, которые испытывают наибольшую трудность. Используя нашу выделенную инфраструктуру для мониторинга машинного обучения, мы будем внимательно изучать поведение модели, продолжая повторять и улучшать эту работу.

В рамках наших следующих шагов мы будем работать над расширением нашей функции скидок на ML для других поставщиков, у которых есть большое количество незастрахованных пациентов. Помогая этим пациентам, мы можем продолжать добиваться больших успехов в выполнении нашей миссии — сделать здравоохранение более доступным и доступным.

Хотите узнать больше об отрасли здравоохранения? Обязательно посетите блог Cedar: https://www.cedar.com/blog/