Краткий обзор наших исследовательских публикаций доступен здесь.

Мы начали нашу компанию, чтобы коренным образом переосмыслить, что значит по-настоящему обеспечить лучшее здравоохранение для каждого человека. Это требует преобразовательных решений, которые увеличивают возможности поставщиков медицинских услуг, а также снижают барьер для доступа пользователей к медицинской помощи. Естественным компонентом решения является тесная бесшовная интеграция AI / ML в поток взаимодействия врача и пациента, который расширяет и масштабирует поставщиков медицинских услуг, а не просто как plug-and-play в существующем рабочем процессе. Чтобы действительно достичь этого, необходимо решить несколько открытых исследовательских проблем на стыке машинного обучения и здравоохранения. Вот почему с самого начала исследования были одним из главных приоритетов компании.

Мы также признаем, что не все исследовательские проблемы можно решить самостоятельно: мы стремимся к активному сотрудничеству с исследовательским сообществом посредством внешнего сотрудничества и в рамках нашей программы исследовательской стажировки. Наше недавнее внешнее сотрудничество включает партнерство со Стэнфордом, Массачусетским технологическим институтом, Технологическим институтом Джорджии, Массачусетской больницей общего профиля и Университетом Вандербильта. Мы активно публикуемся на конференциях высшего уровня, чтобы поддержать сообщество, а также чтобы наши исследования были проверены.

В этом сообщении блога мы описываем некоторые из наших исследований, в частности, в областях принятия клинических решений и обработки естественного языка, которые были нашими двумя основными областями внимания из-за их связи со здравоохранением в целом и с Curai Health, в специфический.

Принятие клинических решений

В идеальном мире принятие клинических решений - это полноценная информационная игра, в которой поставщик медицинских услуг имеет всю информацию о пациенте, и вся эта информация используется для заключения относительно диагноза и плана лечения. Как мы описали в предыдущем сообщении в блоге, в реальном мире этого не происходит по многим причинам. Наша гипотеза состоит в том, что диагностические системы искусственного интеллекта дополнят поставщиков медицинских услуг для решения полной информационной игры, собирая всю необходимую информацию от пациентов, в то же время предлагая диагностические возможности и планы лечения [1].

Чтобы клинические решения AI / ML были действительно эффективными, эти системы должны быть развернуты «в дикой природе». Под этим мы подразумеваем, что системы AI / ML должны правильно принимать решения в средах и медицинских ситуациях, с которыми они, возможно, никогда не сталкивались. Если система очень хороша при тысячах условий; когда он используется в дикой природе, ему, возможно, потребуется оказать помощь пациенту с тем тысячным и одним заболеванием, которого он никогда раньше не видел.

Хотя стремление к тому, чтобы системы искусственного интеллекта работали «в условиях дикой природы» - непростая задача, мы можем добиться прогресса в достижении этой цели, если у нас будет постоянно присутствовать медицинский провайдер. Для этого нам нужно, чтобы эти системы обладали двумя свойствами. Во-первых, системы AI / ML должны быть расширяемыми: это означает, что они автоматизируют части рабочего процесса при взаимодействии между поставщиком медицинских услуг и пациентом и постепенно обновляют себя по мере поступления дополнительных данных или обучения поставщик в петле. Это будет означать, что модели со временем станут более осведомленными по мере того, как они будут больше взаимодействовать. Из-за необходимости выборочной автоматизации этим моделям искусственного интеллекта также необходимо знать, что им известно, а что нет, чтобы система могла переключаться между автоматизацией задачи или любезным обращением к поставщикам. Это также укрепляет доверие поставщиков.

Медицинский диагноз

Диагноз - это сопоставление данных пациента (нормальный и ненормальный анамнез, физикальное обследование и лабораторные данные) с нозологией болезненных состояний, [3]

Расширяемые модели для диагностики

С 1970-х годов были предприняты значительные усилия по созданию поддержки принятия клинических решений на основе искусственного интеллекта. Ранние подходы во многом зависели от экспертных систем, в которых медицинские эксперты курировали базы знаний и алгоритмы вывода, основанные на медицинских исследованиях. Эти медицинские исследования дороги в проведении и могут быть ограничены по своему размеру и способности быстро распространяться на население в целом. Модели с машинным обучением для диагностики многообещающие с точки зрения масштабируемости и расширяемости за счет использования данных, хранящихся в электронных медицинских картах, но не предлагают немедленного способа кодирования предшествующих медицинских знаний.

Наше самое раннее исследование задавало следующий вопрос: «Как мы разрабатываем расширяемые модели машинного обучения с нуля? Как мы можем использовать медицинские знания, закодированные за более чем пятьдесят лет работы экспертных систем искусственного интеллекта, созданных вручную, для медицинской диагностики? »

Мы решили эти вопросы, рассматривая экспертные системы как данные заранее: мы использовали экспертные системы как симулятор клинического случая, и эти случаи используются в качестве обучающих данных для изучения модели для диагностики.

Обучение у экспертов: от экспертных систем к диагностическим моделям с машинным обучением
М. Равури, А. Каннан, Г. Цо, X. Аматриан
Машинное обучение для здравоохранения ( MLHC), 2018 г.

С пандемией COVID-19 мы показали, как мы можем быстро обновить эти модели, чтобы учесть наши развивающиеся знания о COVID-19, используя данные из средства проверки симптомов COVID-19, часто обновляемых практиками. Мы показываем, что наш подход может точно моделировать новые входящие данные о COVID-19, сохраняя при этом точность при условиях, которые моделировались в прошлом.

COVID-19 в дифференциальной диагностике онлайн-оценки симптомов
А. Каннан, Р. Чен, В. Венкатараман, Г. Цо, Х Аматриан

Одной из самых больших проблем в изучении модели комплексной диагностики для всех заболеваний является отсутствие доступа к достаточным данным из-за правил HIPAA или из-за редкости (что хорошо!) Болезней или их фенотипов. Согласно Международной классификации болезней (МКБ) существуют тысячи заболеваний, а экспертные системы охватывают несколько сотен заболеваний.

Мы решили эту проблему, явно представив медицинский диагноз как простую задачу обучения, которая может обрабатывать длинные хвосты данных и хорошо работать с классами как в головном, так и в хвостовом распределении. Мы расширили прототипные сети, чтобы изучить локальные кластеры для каждого заболевания для обработки нескольких фенотипов. После развертывания модель также легко расширяется для новых классов заболеваний за счет использования нескольких клинических случаев, отмеченных практикующим специалистом на платформе.

Прототипные кластерные сети для диагностики дерматологических заболеваний
В Прабху, А. Каннан, М. Равури, М. Чаблани, Д. Зонтаг, X Аматриан
Машинное обучение NeurIPS для здоровья (ML4H), 2018
Машинное обучение для здравоохранения (MLHC), 2019 г.

Зная, когда обратиться к поставщикам

В недавней работе, опубликованной в AMIA, мы представили проблему компромисса между количеством заболеваний и точностью диагностических моделей в пользовательских настройках. Мы показываем, что моделирование интересующих заболеваний (например, обычно наблюдаемых на платформе) обеспечивает гораздо лучшую точность, чем моделирование всех болезней.

Компромисс между точностью и охватом в моделях диагностики, ориентированных на пациента
А. Каннан, Дж. Фрис, Э. Крамер, Дж. Чен, Н. Шах, Х Аматриан
AMIA Informatics Саммит, 2020

В последующей работе мы поставили задачу открытого медицинского диагноза, в котором предложенная модель явно моделирует нераспределение. Когда модель предсказывает, что клинический случай не распространяется, это указывает на то, что модель полностью передана поставщику без каких-либо предложений. Мы также показываем, как моделировать диагностические ансамбли с открытым набором, когда обучающие данные распределяются по нескольким сайтам здравоохранения, которые не позволяют объединение данных.

Открытая медицинская диагностика
В Прабху, А. Каннан, Дж. Цо, Н. Катария, М. Чаблани, Д. Зонтаг, Х Аматриан
Машинное обучение NeurIPS для здоровья (ML4H), 2019
Конференция ACM по вопросам здоровья, выводов и обучения (ACM- CHIL), 2020 г.

Обработка естественного языка

В Curai Health основным способом взаимодействия с пациентами / пользователями является текстовый чат. Для пациентов это вписывается в их занятую жизнь, поскольку в настоящее время это доступно и доступно. Для практиков на платформе интерфейс чата улучшает возможности оперативного масштабирования, поскольку он может комбинировать синхронные и асинхронные режимы при соответствующем уровне приоритетов. Поэтому, как мы описали в нашем предыдущем сообщении в блоге, прогресс в понимании естественного языка важен для нашей работы.

В последние годы в НЛП произошли огромные успехи (например, GPT-3, BERT). Однако есть ряд важных проблем, которые необходимо решить, когда мы применяем НЛП в здравоохранении. Это включает в себя передачу медицинских знаний на языке и преодоление отсутствия наборов данных для конкретных задач. Теперь мы опишем, как мы решаем эти проблемы.

Ответы на медицинские вопросы

Скорость, с которой медицинские вопросы задаются в Интернете, намного превышает возможности практикующих специалистов ответить на них. Одним из способов решения этой проблемы является создание системы поиска, которая может автоматически сопоставлять неотвеченные вопросы с ответами на вопросы с тем же значением или отмечать их как приоритетные для врача, если не существует аналогичных ответов на вопросы. Создание такой системы поиска связано с двумя основными проблемами: во-первых, это набор данных, который закодирует нюансы медицинских знаний (например, могу ли я принимать алкоголь во время беременности? И могу ли я принимать алкоголь после беременности?). Во-вторых, мы понимаем, что в сфере здравоохранения простой ответ не всегда может решить проблему (как в примере выше), и поэтому модели машинного обучения для ответов на вопросы должны иметь возможность направлять пациента к поставщикам услуг.

Чтобы решить первую проблему, в недавней работе, представленной на NeurIPS Машинное обучение для здоровья, 2019, мы расширяем возможности языковых моделей, используя глубину информации, которая хранится в наборе данных пары медицинских вопросов и ответов, чтобы предоставить необходимые медицинские данные. знания. Мы показываем, как предварительная подготовка трансформаторной сети к задаче сопоставления медицинских вопросов и ответов позволяет встроить соответствующие медицинские знания в модель, которых у нее нет. Затем мы настраиваем внутренний (общедоступный) набор данных о схожести вопрос-вопрос.

Эффективное обучение передачи для выявления похожих вопросов: соответствие вопросов пользователей часто задаваемым вопросам о COVID-19
К. МакКрири, Н. Катария, А. Каннан, М. Чаблани, X Amatriain
KDD, 2020

Во время этого COVID наблюдается огромный всплеск количества вопросов от пользователей. Мы расширили вышеупомянутую работу, чтобы использовать ее в контексте тщательно подобранного набора данных часто задаваемых вопросов, связанного с COVID. Мы включили на нашей платформе возможность напрямую связывать пациентов с нашими поставщиками, когда это необходимо.

Обучающийся медицинский разговорный агент

Еще одна область исследований, которую мы активно исследуем, - это обучение разговорных агентов для взаимодействия с пациентами. Задача изучения медицинских диалоговых агентов сложна по многим причинам. Во-первых, определение «задачи» является тонким: задача медицинской диагностики включает в себя задачу установления правильного диагноза (более нескольких тысяч) для пациента. Во-вторых, модели должны быть предельно точными, чтобы раскрыть всю необходимую информацию от пациента путем совместного проведения медицинских рассуждений во время сбора информации с пациентами.

Мы сделали первый шаг в этом направлении, сформулировав проблему как помощник практикующего в разговоре, в котором модель предлагала бы ответы практикующему специалисту в зависимости от контекста разговора на данный момент. Мы сформулировали эту генерацию ответа как задачу распознавания, цель которой состоит в том, чтобы ранжировать похожие ответы из кластеров ответов. Мы показываем, что наш подход кластеризации контекстов и определения ответов, описывающих контекст, имел гораздо лучшую точность, чем изучение полной генеративной модели для генерации ответов.

Классификация как декодер: торговая гибкость для управления в нейронном диалоге
С. Шлейфер, М. Чаблани, Н. Катария, А. Каннан, X Аматриан
Машинное обучение NeurIPS для здоровья (ML4H) , 2019

Резюме Медицинского диалога

Еще одна важная область исследований - это обобщение медицинских диалогов. Резюме медицинского диалога позволяют эффективно передавать пациента между практикующими врачами, чтобы их можно было использовать для принятия медицинских решений и последующего наблюдения. Для пациента он также служит подробным резюме их разговора с врачом. Понимание медицинского разговора между пациентом и поставщиком медицинских услуг создает уникальные проблемы понимания естественного языка, поскольку он сочетает в себе элементы стандартного открытого разговора с элементами очень специфической области, которые требуют специальных знаний и медицинских знаний.

В недавней работе мы расширили сеть генератора указателей, включив важные свойства медицинских разговоров, такие как медицинские знания, полученные из стандартизированных медицинских онтологий, а также принимая во внимание подтверждения симптомов пациента.

Доктор. Резюмируйте: глобальное обобщение медицинского диалога путем использования местных структур
А Джоши, Н. Катария, Х Аматриан, А. Каннан
EMNLP - Результаты, 2020

Мы работаем в то время, когда открываются огромные возможности, а также есть обязательства по расширению доступа к медицинской помощи. Мы предполагаем, что технологии и искусственный интеллект будут играть в этом огромную роль. В то же время системы искусственного интеллекта нельзя просто исключить из существующего рабочего процесса - их необходимо интегрировать в комплексное медицинское обслуживание, приносящее пользу как пациентам, так и поставщикам медицинских услуг. В Curai мы сосредоточены именно на этом. Пожалуйста, свяжитесь с нами, если эта область исследований вас интересует и вы заинтересованы в том, чтобы стать частью нашей миссии.