Искусственный интеллект (ИИ) - модное слово этого десятилетия. Кажется, что он повсеместен - от финансов до промышленности, от здравоохранения до автомобильного сектора, он находит применения почти во всех областях. В этом блоге будет рассмотрено одно из таких интересных приложений машинного обучения (ML), которое имеет значение для всего человечества, то есть для сектора здравоохранения.

Прежде чем мы рассмотрим роль ИИ и машинного обучения в сфере здравоохранения, давайте посмотрим, что означают эти термины. Известный компьютерный ученый Том М. Митчелл дал широко цитируемое, более формальное определение алгоритмов, изучаемых в области машинного обучения: Считается, что компьютерная программа учится на опыте E в отношении некоторого класса. задач T и показатель эффективности P, если его производительность при выполнении задач в T, измеренная с помощью P, улучшается с опыт E [1]. По сути, машинное обучение относится к набору программ, которые учатся и совершенствуются на основе данных и опыта, а не явно программируются в соответствии с определенным набором правил. Такое обучение стало возможным благодаря вероятностным и статистическим методам. Машинное обучение - это разновидность искусственного интеллекта, которая также включает языковую обработку, интеллектуальную робототехнику и так далее.

В области здравоохранения машинное обучение приобретает все большее значение в том смысле, что с его помощью можно делать прогнозы и делать прогнозы на основе предыдущих медицинских данных. В 2015 году американский кардиолог Эрик Тополь [2] представил доказательства того, что нынешние достижения в области медицинских технологий и дальнейшие достижения в ближайшем будущем, такие как носимые устройства, более быстрые и дешевые средства геномного секвенирования и т. Д., Приведут к огромному увеличению данных для отдельные пациенты. Но недостаточно того, что у нас есть достаточно и больше данных, гораздо важнее понять смысл этих данных. Данные необходимо использовать для прогнозирования, предотвращения и лечения заболеваний, особенно хронических [2]. В частности, нам нужна предсказательная сила. И машинное обучение - это способ использовать эту способность прогнозирования на основе огромных объемов данных [3].

Проблемы в сфере здравоохранения

Сегодня сектор здравоохранения сталкивается с несколькими проблемами. Некоторые из них описаны ниже:

1. Персонализированная медицина. Разные люди по-разному реагируют на лечение в зависимости от ряда факторов, таких как предыдущее состояние здоровья, генетика, образ жизни и т. д. Чтобы найти лучший курс лечения конкретному пациенту необходимо выяснить влияние различных вариантов лечения на этого пациента, а не в среднем на большую популяцию. Чтобы достичь этого, нам нужно попытаться понять индивидуальные эффекты лечения, а не только средние эффекты [3]. Но это вне досягаемости современных медицинских знаний и практик. Клинические испытания составляют основу для проверки эффективности новых лекарств и методов лечения. Но они ограничены исключением пожилых пациентов и пациентов с множественными заболеваниями по этическим соображениям. Но на самом деле именно такие пациенты действительно подлежат лечению или лечению, особенно при хронических заболеваниях. Более того, руководящие принципы, разработанные на основе клинических испытаний, основаны на средних эффектах, обнаруженных в испытании, хотя часто бывает, что конкретное лекарство или лечение могут иметь очень разные эффекты для некоторых конкретных подгрупп населения, чем для населения в целом. . Клинические испытания часто предоставляют много информации о средних эффектах лечения, но гораздо меньше информации об индивидуальных эффектах лечения. Следовательно, персонализированная медицина по-прежнему остается проблемой в здравоохранении.

2. Визуализация и диагностика. Визуализация и диагностика - это передовая область медицины, но проблемы все еще остаются, особенно когда речь идет о хронических заболеваниях, таких как рак. Проблема часто заключается в том, чтобы правильно диагностировать болезнь по изображению опухоли или поражения, по широкому кругу болезней. Это задача, которая может оказаться непосильной для врачей и может занять несколько дней. Часто решение принимают команды врачей, а не один мозг. Неправильный медицинский диагноз может привести к катастрофическим последствиям, поскольку неправильный метод лечения может привести к дальнейшим осложнениям, чем облегчение заболевания.

3. Оценка риска и прогноз. Оценка риска включает понимание серьезности заболевания или того, на какой стадии оно находится. Это важно, потому что оно дает информацию о каждом аспекте ухода за пациентом, от профилактики заболевания до выбора курса лечения. В настоящее время большая часть оценки риска не проводится достаточно систематически или на основе какой-либо формальной модели и, следовательно, не принимает во внимание объем доступной информации о пациенте. Даже в тех областях, в которых оценка риска выполняется на основе формальной модели, которая дает конкретные оценки риска, это обычно делается на основе линейной модели, такой как модель пропорциональных рисков Кокса [3], и с использованием ограниченное количество подобранных вручную характеристик, часто выбираемых либо по медицинским заключениям самих врачей, либо с помощью упрощенных методов выбора переменных [3].

4. Скрининг. В отношении большинства заболеваний текущие руководящие принципы предписывают универсальный подход, при котором процедуры скрининга проводятся через регулярные промежутки времени для каждого пациента в соответствующей популяции. Например, в нескольких странах для женщин проводятся регулярные обследования на рак шейки матки и рака груди. Однако реальный риск для пациентов варьируется индивидуально, и часто даже пациенты с низким уровнем риска проходят скрининг, что является пустой тратой социальных ресурсов. Мало того, это может быть дорогостоящим и инвазивным для пациентов с таким низким риском, в то время как пациенты с высоким риском не проходят скрининг достаточно часто, что вызывает осложнения из-за позднего выявления. Политика скрининга также должна учитывать генетические маркеры, семейный и личный анамнез болезней и сопутствующих заболеваний. В отношении некоторых заболеваний, таких как рак груди и толстой кишки, текущая политика скрининга Соединенного Королевства учитывает такие маркеры [3]. Однако даже для таких заболеваний текущая политика группирует пациентов в очень большие корзины и придерживается одной процедуры в каждой корзине [3].

5. Электронные медицинские записи. В EHR хранятся данные о пациентах для улучшения медицинского обслуживания и предоставления персонализированного лечения и исторического учета. Эти данные могут быть в виде радиологических изображений, диагноза, классификации заболевания, обзора состояния здоровья врача, демографических данных, рецептов, лабораторных тестов и результатов [3]. С годами количество таких записей увеличилось пропорционально, что затрудняет работу с ними для медицинских работников и медицинских работников. Кроме того, источники данных постоянно расширяются, и на рынке появляются все более персонализированные и носимые медицинские технологии. Включение всего этого в записи и их ведение, а также получение из них достоверной информации остается сложной задачей. Текущие электронные медицинские карты могут рассчитывать риски только для нескольких заболеваний и отображать только те, которые специально запрашиваются. С другой стороны, нам нужны медицинские записи, которые могут предсказать риск заболеваний, о которых еще не подозревают врачи или сами пациенты.

6. Системы мониторинга и раннего предупреждения. Это тесно связано с предыдущим пунктом об ЭУЗ. Во многих случаях госпитализированные пациенты страдают внезапным, опасным для жизни ухудшением состояния, таким как остановка сердца или септический шок, и уровень смертности от этих инцидентов очень высок (достигает 75%) [3]. Тем не менее, многие из этих событий можно было предотвратить, и можно было бы избежать смертей, если бы было сделано предупреждение раньше, даже через несколько часов. К сожалению, существующие системы раннего оповещения, которые широко используются в больницах, не оказались адекватными: они пропускают многие события и выдают множество ложных тревог, что напрягает ресурсы больниц и приводит к усталости от тревог у лиц, обеспечивающих уход [3].

Возможности искусственного интеллекта и машинного обучения в здравоохранении

Люди довольно хорошо понимают и делают выводы на основе данных, собранных из ограниченного набора источников информации за короткий промежуток времени. Они менее опытны в понимании и выводе выводов из данных, собранных из обширного ассортимента различных источников информации в течение длительного периода времени - даже несмотря на то, что такие данные могут в действительности иметь огромное влияние на все части динамики, и их игнорирование может нанести серьезный ущерб прогнозам. . В клинической сфере это особенно очевидно на том основании, что поток информации поступает из самых разных источников (визуализация, геномика, жизненно важные показатели и лабораторные тесты, собираемые время от времени). Получение информации из этой информации необходимо для того, чтобы переход на более высокий уровень прогноза, диагностики и лечения. Это особенно важно при лечении сложных заболеваний, например, болезни Альцгеймера, рака, сердечных заболеваний, муковисцидоза, диабета и т. Д., Которые демонстрируют сложные фенотипы и требуют сложного анализа данных - с множеством характеристик, а не только с несколькими - что сложно для людей, но проще для машин. Уже есть много информации, которую люди могут отслеживать и использовать, но ее нельзя использовать с существующими ресурсами. Это одна из причин того, что методы оценки клинической опасности, как правило, используют только подмножество регистрируемых функций: врачи в основном не могут контролировать и использовать сотни или даже тысячи функций, которые могут быть уже доступны.

Более того, объем информации растет в геометрической прогрессии; не просто информация в электронных медицинских картах, но также геномная информация, протеомная информация и так далее [3]. Хотя часть этой информации (например, геномная информация) является фиксированной, некоторые из них быстро меняются - и важна не только текущая информация, но и история / направление изменения данных. Кроме того, по мере того, как правила постоянно меняются, собираются самые разные данные. Статическим клиническим методам трудно приспособиться к этим изменениям, поскольку они были сделаны в соответствии с предыдущими рекомендациями.

Методы машинного обучения могут улучшить описанные выше сценарии в свете того факта, что их можно постоянно переобучать, чтобы учитывать эти изменения и приспосабливаться к ним. Прогресс в понимании, профилактике и лечении таких заболеваний потребует создания новых методов, которые разрушают стены между машинным обучением, статистикой и математикой, и использования этих новых методов для обнаружения новых связей, причин и причинно-следственных связей между клиническими данными, генетическими данными, данными метаболизма, окружающей средой. данные, социальные данные и т. д. и их влияние на риск, частоту и траекторию заболевания [3].

Как мы можем решить указанные выше проблемы с помощью ИИ / МО?

Прямо сейчас машинное обучение и, в частности, глубокое обучение (DL) начало оказывать огромное влияние на различные области здравоохранения. Растущая доступность медицинской информации и быстрое улучшение техники сделали возможным эти результаты [4]. Методы DL могут выявить клинически значимую информацию, скрытую в больших массивах данных о здравоохранении, которые, в свою очередь, могут быть использованы для принятия решений, лечения, контроля и предотвращения состояний здоровья [4]. Некоторые области применения DL включают поведенческие реакции, связанные со здоровьем, обработку EHR и получение научно обоснованного лечения из текста, анализ и классификацию, связанные с глазами, лечение рака, диагностику сердца [и анализ активности мозга [4]. Это делает лечение более простым для врачей и выгодным для пациентов с более быстрым и продуктивным мониторингом.

Давайте посмотрим, как машинное обучение и глубокое обучение могут решить некоторые из проблем, упомянутых в предыдущем разделе, и углубимся в детали двух конкретных случаев: классификация рака кожи и роль искусственного интеллекта в COVID-19.

1. Персонализированная медицина. Достижения в области машинного обучения сделали возможным узнавать индивидуальные эффекты лечения на основе данных наблюдений, то есть данных, собранных в клинической практике. Как правило, такое обучение представляет собой действительно сложную проблему, поскольку данные обычно являются необъективными (клиницисты выбирают, какие пациенты должны получать лекарство / лечение, а не рандомизацией), контрфактами (каков был бы исход, если бы пролеченный пациент не лечился, или, наоборот, если бы пациент, не получавший лечения, был пролечен) не наблюдаются, и как на решения, так и на результаты могут влиять скрытые факторы (не записанные в данных наблюдений) [3]. Кроме того, поскольку не соблюдаются противоречия, прогностические модели не могут быть протестированы на основе выборки. Однако недавняя работа в области машинного обучения внесла некоторые изменения в эту проблемную область. Стефан Вейджер и Сьюзан Эти адаптировали метод случайного леса, в котором прогнозы имеют статистически достоверные доверительные интервалы [5]. Ахмед Алаа и Михаэла ван дер Шаар разработали общие руководящие принципы для создания алгоритмов машинного обучения, которые оценивают индивидуализированные эффекты лечения, характеризуя основные пределы того, что может быть достигнуто, и устанавливая условия, при которых эти фундаментальные ограничения могут быть реализованы [6]. Их анализ показывает, что важность различных характеристик данных наблюдений зависит от размера выборки. В случае выборки небольшого размера смещение отбора является наиболее важным узким местом, тогда как в случае выборки большого размера моделирование контрольных и обработанных результатов является самым большим узким местом. Основываясь на этих выводах - и других результатах теоретического анализа [6,7], они разрабатывают практические алгоритмы машинного обучения, которые превосходят предыдущие методы.

2. Оценка риска и прогноз. Как упоминалось в предыдущем разделе, оценка риска не является достаточно систематической, или даже если это так, она обычно следует линейным моделям. Методы машинного обучения могут лучше справляться с этими задачами по двум причинам. Во-первых, это получение информации: методы на основе машинного обучения могут обрабатывать большое количество функций. Это важно, потому что чем больше возможностей можно проанализировать, тем точнее становится прогноз риска, поскольку разные характеристики по-разному влияют на риск для разных типов пациентов. Вторая причина - выгода от моделирования: методы на основе машинного обучения могут лучше использовать одни и те же функции, лучше выявляя и фиксируя сложные взаимодействия между этими функциями [3]. Эти достижения позволяют методам на основе машинного обучения генерировать более точные прогнозы и, следовательно, давать более точные рекомендации по лечению для каждого пациента. Это показывает, почему модели на основе машинного обучения могут превосходить линейные модели при заболеваниях, в которых задействовано большое количество переменных и очень сложные лежащие в основе взаимодействия между ними. Еще одно преимущество моделей на основе машинного обучения заключается в том, что они могут обнаруживать важность функций и / или взаимодействий между ними, которые ранее не были поняты или считались важными [3]. Например, работа Alaa et.al. обнаружили неожиданно важную роль оксигенации - в дополнение к ОФВ1 (объем форсированного выдоха) - в прогнозировании снижения у пациентов, страдающих муковисцидозом [8].

3. Системы мониторинга и раннего предупреждения. Методы машинного обучения достигли в этом серьезного прогресса. Сариа и соавторы разработали методы ML, которые позволяют более точно и своевременно прогнозировать септический шок, чем те, которые предоставляются обычно используемыми клиническими моделями [9]. Ван дер Шаар и др. Разработали методы машинного обучения, которые обеспечивают более точные и своевременные прогнозы остановки сердца в больнице, чем те, которые определены существующими клиническими моделями [10]. Методы, используемые в этих двух сценариях, очень разные, в основном потому, что они представляют очень разные условия. Но есть много видов внезапного ухудшения состояния в больнице, и создание прогнозной модели для каждого из них представляет собой очень сложную задачу. Это остается проблемой для разработки большего количества таких систем.

Теперь давайте рассмотрим два тематических исследования, чтобы увидеть, как методы ИИ помогли в соответствующих сценариях.

Пример 1: Классификация рака кожи с помощью глубоких нейронных сетей

Эстева и др. [11] разработали систему классификации рака кожи на уровне дерматологов с использованием сверточных нейронных сетей (CNN). CNN состоит из входного слоя, нескольких скрытых слоев и выходных слоев нейронов или единиц. Каждое соединение между блоками на разных уровнях имеет вес. Веса обновляются путем минимизации функции оптимизации, которая пытается уменьшить разницу между исходным и прогнозируемым выходом нейронной сети.

В своей работе авторы использовали наборы данных открытого доступа, которые состояли из изображений кожных повреждений. Эти изображения были отмечены как злокачественные или доброкачественные. Они использовали изображения поражений с разных точек зрения, и были приняты меры, чтобы не было перекрытия изображений одного и того же поражения с разных точек зрения в тестовой и обучающей выборке. Набор данных состоял из 129450 поражений кожи, включающих 2032 различных заболевания, которые были сопоставлены с 757 учебными классами на основе медицинской таксономии кожных заболеваний [11].

Для обучения они использовали модифицированную версию архитектуры CNN Google Inception v3 [12]. Они удалили последний слой классификации из сети и повторно обучили его своим набором данных, точно настроив параметры для всех слоев. Во время обучения они изменили размер каждого изображения до 299 × 299 пикселей, чтобы сделать его совместимым с исходными размерами сетевой архитектуры Inception v3 и использовать возможности естественного изображения, полученные в предварительно обученной сети ImageNet. Эта процедура известна как трансферное обучение [11].

CNN была обучена с использованием метода обратного распространения ошибки. Все слои сети были настроены с использованием одинаковой глобальной скорости обучения 0,001 и коэффициента затухания 16 каждые 30 эпох. RMSProp [13] использовался в качестве алгоритма оптимизации с затуханием 0,9, импульсом 0,9 и эпсилон 0,1. Платформа глубокого обучения Google TensorFlow [14] использовалась для обучения, проверки и тестирования сети. Во время обучения изображения были увеличены в 720 раз. Каждое изображение произвольно вращалось в диапазоне от 0 ° до 359 °. Затем из изображения вырезается самый большой вертикальный вписанный прямоугольник и зеркально отражается по вертикали с вероятностью 0,5 [11].

Чтобы воспользоваться преимуществами мелкозернистой информации, содержащейся в структуре таксономии, алгоритм обучен разделять болезни на мелкозернистые учебные классы (например, амеланотическая меланома и акролентигинозная меланома). Во время вывода CNN выводит распределение вероятностей по этим классам штрафов. Чтобы восстановить вероятности для представляющих интерес классов более грубого уровня (например, меланомы), мы суммируем вероятности их потомков, например, суммируя по амеланотической меланоме и акролентигной меланоме [11].

Эффективность алгоритма была подтверждена с использованием 9-кратной перекрестной проверки. Во-первых, алгоритм был проверен с использованием трех классов болезней - узлов первого уровня таксономии, которые представляют доброкачественные поражения, злокачественные поражения и неопухолевые поражения [11]. В этой задаче CNN достигает общей точности 72,1 ± 0,9% (среднее ± стандартное отклонение), а два дерматолога достигают точности 65,56% и 66,0% на подмножестве проверочного набора [11]. Во-вторых, они проверили алгоритм, используя разделение болезней на девять классов - узлы второго уровня - так что болезни каждого класса имеют аналогичные планы лечения. CNN достигает общей точности 55,4 ± 1,7%, тогда как те же два дерматолога достигают точности 53,3% и 55,0% [11].

Наконец, прямое функционирование CNN было протестировано советом из 21 сертифицированного дерматолога. Метрикой, выбранной для сравнения, была чувствительность и специфичность, где чувствительность - это отношение истинных положительных результатов ко всем положительным результатам, а специфичность - это отношение истинных отрицательных результатов ко всем отрицательным результатам. CNN достигает производительности, сопоставимой со всеми протестированными экспертами, демонстрируя искусственный интеллект, способный классифицировать рак кожи с уровнем компетентности, сопоставимым с дерматологами [11].

Пример 2: COVID и искусственный интеллект

Мир раскачивается от глобальной пандемии, подобной которой раньше не было. Новое заболевание, вызванное коронавирусом, распространилось по странам, затронув миллионы людей напрямую и каждого из нас косвенно.

В этом сценарии искусственный интеллект фактически сыграл огромную роль в сдерживании болезни везде, где это было возможно. Еще до того, как угроза стала известна миру, системы искусственного интеллекта обнаружили вспышку неизвестного вируса пневмонии. Поскольку вспышка теперь превратилась в глобальную пандемию, инструменты и технологии искусственного интеллекта использовались для поддержки усилий политиков, медицинского сообщества и общества в целом по управлению каждой стадией кризиса и его последствиями: обнаружение, предотвращение, реагирование, восстановление и ускорить исследования.

Ускорение исследований с использованием ИИ для понимания и лечения COVID-19

· Различные методы искусственного интеллекта помогли правительствам и медицинскому сообществу понять вирус COVID-19 и стимулировать исследования в области лечения путем быстрого анализа огромных объемов исследовательского материала. Алгоритмы обработки естественного языка (NLP), которые могут анализировать большие объемы текстовых данных, раскрыли историю вируса, передачу и диагностику, меры управления и уроки предыдущих эпидемий.

· Модели глубокого обучения помогают прогнозировать несколько видов лекарств или методов лечения, которые могут лечить COVID-19. DeepMind и несколько других организаций использовали глубокое обучение для прогнозирования структуры белков, связанных с SARS-CoV-2, вирусом, вызывающим COVID-19 [15].

· Платформы, посвященные этому делу, позволяют консолидировать и обмениваться междисциплинарным опытом в области ИИ, в том числе в глобальном масштабе. Правительство США, например, начало обмен с правительствами всего мира и новаторами, который включает использование ИИ для ускорения расследования материалов исследования коронавируса, доступных через веб-сайт Kaggle [15]. Предоставляется доступ к наборам данных в эпидемиологии, биоинформатике и смежных областях, например в рамках конкурса COVID-19 Open Research Dataset Challenge, проводимого правительством США и партнерскими организациями, который предоставляет доступ к более 29 000 академических статей по коронавирусу и COVID-19 [15].

· Вычислительная мощность для запуска алгоритмов ML / DL для прогнозов и исследований COVID также стала доступной для всех крупных технологических компаний, таких как Amazon, Microsoft и Google, благодаря усилиям государственного и частного секторов, таким как Консорциум высокопроизводительных вычислений COVID-19 и искусственный интеллект. для здравоохранения частные и частные лица, жертвующие вычислительные мощности (например, Folding @ home) [15].

· Инновационные подходы, такие как хакатоны, призы и сотрудничество с открытым исходным кодом, помогают ускорить исследования решений на основе искусственного интеллекта для борьбы с пандемией. Например, программа «CoronaHack - AI против Covid-19» в Соединенном Королевстве направлена ​​на поиск идей у ​​специалистов по обработке данных, бизнеса и биомедицинских исследователей об использовании ИИ для контроля и управления пандемией [15].

Использование ИИ для обнаружения, диагностики и предотвращения распространения коронавируса

ИИ также можно использовать для распознавания, диагностики и предотвращения распространения пандемии. Алгоритмы ML / DL, которые идентифицируют закономерности и аномалии, уже работают для обнаружения и прогнозирования распространения COVID-19, в то время как системы распознавания изображений ускоряют медицинскую диагностику. Например:

· Системы раннего предупреждения на основе искусственного интеллекта смогли понять и выявить эпидемиологические закономерности, добывая средства массовой информации, онлайн-контент и другие источники информации на нескольких языках. Например: Система раннего предупреждения ВОЗ.

· Инструменты искусственного интеллекта могут помочь идентифицировать цепочки передачи вирусов и отслеживать более широкие экономические последствия [. Во многих сценариях технологии на основе ИИ продемонстрировали свою способность понимать эпидемиологические данные быстрее, чем традиционные отчеты о состоянии здоровья. Такие институты, как Университет Джона Хопкинса и ОЭСР (oecd.ai), также предоставили интерактивные информационные панели, которые отслеживают распространение вируса через живые новости и данные в реальном времени о подтвержденных случаях коронавируса, выздоровлении и смертях [15].

· Быстрая диагностика имеет решающее значение для ограничения инфекций и понимания их распространения. Примененный к данным и изображениям симптомов, ИИ помог быстро диагностировать случаи COVID-19 [15]. Внимание уделяется сбору данных, репрезентативных для всего населения, чтобы гарантировать масштабируемость и точность.

· Различные страны используют наблюдение за населением для отслеживания случаев COVID-19 (например, в Южной Корее алгоритмы используют кадры с камеры, данные геолокации и записи кредитных карт для отслеживания и отслеживания пациентов с коронавирусом). Китай присваивает уровень риска (цветовой код - красный, желтый или зеленый) каждому человеку, имеющему риск заражения с помощью программного обеспечения для сотовых телефонов [15]. В то время как модели машинного обучения используют данные о поездках, платежах и коммуникациях для прогнозирования места следующей вспышки и информирования пограничных проверок, поисковые системы и социальные сети также помогают отслеживать болезнь в режиме реального времени [15].

· Некоторые страны, такие как Австрия, Китай, Израиль, Польша, Сингапур и Южная Корея, создали системы отслеживания контактов для обнаружения возможных путей заражения. В Израиле, например, данные геолокации использовались для идентификации людей, вступающих в тесный контакт с известными вирусоносителями, и отправки им текстовых сообщений с указанием немедленно изолировать себя [15].

· Полуавтономные роботы и дроны развертываются для удовлетворения неотложных потребностей в больницах, таких как доставка еды и лекарств, уборка и стерилизация, помощь врачам и медсестрам и доставка оборудования.

Этические последствия использования технологий искусственного интеллекта в здравоохранении

Существует несколько этических проблем, связанных с полной зависимостью от ИИ в здравоохранении без надзора экспертов [16]:

  • В данных, используемых для обучения алгоритмов, может быть внутренняя предвзятость, которая будет отражаться в прогнозах, сделанных этими алгоритмами, и рекомендациях, которые они делают. В конце концов, любой ИИ настолько хорош, насколько хорошо в него вводятся данные. Кроме того, алгоритмы могут быть специально разработаны так, чтобы искажать результаты, в зависимости от того, кто их разрабатывает, и от мотивов развертывающих их программистов, компаний или систем здравоохранения [16].
  • Есть проблема интерпретируемости и объяснимости. Большинство алгоритмов машинного обучения - это «черные ящики», то есть невозможно по-настоящему объяснить внутреннюю работу этих алгоритмов машинного обучения. Это делает выходные данные таких алгоритмов не интерпретируемыми. Точно так же их нельзя объяснить, почему результаты такие, каковы они есть, и почему одни характеристики важнее других. Это проблема, особенно в алгоритмах глубокого обучения, поскольку они становятся все глубже и глубже, теряется интерпретируемость.

Совершенно естественно, что врачи должны уметь понимать, как создаются алгоритмы, что в них происходит, оценивать источники данных и их качество, которые используются для создания статистических моделей, понимать, как работают модели, и гарантировать, что врачи не станут чрезмерно зависимы от них [16].

  • Собранные данные о здоровье пациентов, диагностике и результатах становятся частью «коллективных знаний» опубликованной литературы и информации, собранной системами здравоохранения, и могут использоваться без учета клинического опыта и человеческого аспекта ухода за пациентами [16]. Это может затруднить аспект конфиденциальности данных в отношении пациентов, поскольку медицинские данные являются чрезвычайно личной и конфиденциальной информацией.
  • Рекомендации, основанные на машинном обучении, могут ввести стороннего «участника» в отношения врача и пациента, бросая вызов динамике ответственности в отношениях и ожиданию конфиденциальности [16]. Это приводит к вопросу о том, кто действительно несет ответственность, если что-то пойдет не так с предсказаниями алгоритма. Необходимо понимание разделения ответственности между врачом, создателями алгоритмов и поставщиками медицинских услуг в целом.

Это настоящие проблемы, и это подводит нас к нашему заключительному пункту. Технологии здравоохранения на основе искусственного интеллекта, несмотря на то, что они продемонстрировали возможности лучше, чем врачи-люди в нескольких областях, следует проявлять осторожность. В отличие от многих других областей, здравоохранение напрямую играет с человеческими жизнями. По крайней мере, в обозримом будущем ИИ не может существовать без людей, и ИИ не заменит имеющихся у нас специалистов в области здравоохранения. Эти двое должны сосуществовать. Следовательно, клинический персонал должен понимать, на что способно ОД, а не бояться этого, и должен полностью участвовать - даже руководить / направлять - продвижение ОД для медицинских услуг. Одна из причин, по которой медицинские работники должны активно участвовать в процессе внедрения ИИ в здравоохранении, заключается в том, что применение машинного обучения в медицине потребует другого подхода в других областях. Машинное обучение оказалось весьма успешным в таких областях, как игры и автономные транспортные средства - в которых у нас есть хорошие модели, в которых взаимодействия (между игроками / объектами и с окружающей средой) регулируются «правилами» (игры, физики). , или закона), которые могут быть четко определены, в которых данных много или их можно легко сгенерировать, и в которых всякий раз, когда решение - например, конкретный ход или последовательность ходов - приводило к сбою / потере, всегда можно было вернуться и попробовать другое решение, чтобы посмотреть, сработает ли альтернатива лучше [3]. Здравоохранение и медицина представляют собой гораздо более сложную область, потому что у нас нет достаточно хороших моделей, взаимодействия регулируются правилами, которые мы не всегда понимаем - правила продолжают развиваться по мере того, как мы узнаем больше о человеческом теле и влиянии на него лекарств. и сложные отношения между различными факторами - а доступность данных ограничена и фиксирована - мы должны учиться на реальных пациентах, которых мы действительно видим, а не на (гипотетических) пациентах, которых мы хотели бы видеть, чтобы получить больше информации. Здесь невозможно подделать данные. Более того, в медицине мы не можем вернуться назад, отменив конкретное решение (операция или лечение); в медицине у нас нет и не может быть никаких противоречий.

Несмотря на это, машинное обучение в медицине получило широкое распространение и продолжает оставаться многообещающим. Очевидно, что использование ML для лечения действительно находится в стадии полового созревания. Следует создавать и утверждать новые модели, а их влияние на жизнеспособность, безопасность, качество и стоимость медицинских услуг следует надлежащим образом изучать. К тому же непонятность и сложность многочисленных вычислений машинного обучения препятствует их восприятию. Широкое распространение стратегий машинного обучения потребует лучшего понимания существующих методов и улучшения новых алгоритмов, которые будут более интерпретируемыми и объяснимыми. Прежде всего, люди и машины должны идти рука об руку; Подобно тому, как технологии всегда помогали человечеству стремительно прогрессировать в предыдущих поколениях, это соединение человеческого и искусственного интеллекта окажется гораздо более мощным, чем любой из них по отдельности. Чтобы ответить на вопрос о названии этого блога, да, AI здесь, чтобы остаться с нами.

Ссылки

[1] Том М. Митчелл, «Машинное обучение», McGraw-Hill, Нью-Йорк, 1997.

[2] Эрик Тополь, «Пациент увидит вас сейчас», BasicBooks, 2015.

[3] Глава 10. van der Schaar, M: Davies, S.C. «Годовой отчет главного врача, 2018 г. Здоровье 2040 - Лучшее здоровье в пределах досягаемости»: Департамент здравоохранения и социальной защиты (2018)

[4] Тобор, И., Ли, Дж., Юханг, Л., Аль-Хандариш, Ю., Кандвал, А., Ни, З., и Ван, Л. (2019). Вмешательство с глубоким обучением для решения проблем здравоохранения: некоторые соображения в области биомедицины. JMIR mHealth and uHealth, 7 (8), e11966. Https://doi.org/10.2196/11966

[5] Стефан Вейджер и Сьюзан Эти. «Оценка и вывод неоднородных лечебных эффектов с использованием случайных лесов». arXiv: 1510.04342, 2017.

[6] Ахмед Алаа и Михаэла ван дер Шаар, «Пределы оценки эффектов гетерогенной обработки: рекомендации по разработке практических алгоритмов», ICML, 2018.

[7] Ахмед Алаа и Михаэла ван дер Шаар, «Байесовский непараметрический причинный вывод: скорость передачи информации и алгоритмы обучения», приняты и опубликованы в IEEE Journal of Selected Topics in Signal Processing (JSTSP), 2018.

[8] Ахмед Алаа, Джинсунг Юн, Скотт Ху и Михаэла ван дер Шаар, «Персонализированная оценка рисков для пациентов, находящихся в критическом состоянии с использованием смеси экспертов по гауссовским процессам», ICML 2016 - Семинар по вычислительным основам для персонализации.

[9] К. Генри, Д. Хагер, П. Проновост и С. Сария. Целевой показатель раннего предупреждения в режиме реального времени (TREWScore) для септического шока. Медицина перевода науки. 7 (299) 299ра 122, 2015 г.

[10] Джинсунг Юн, Ахмед Алаа, Скотт Ху, Михаэла ван дер Шаар, «ForecastICU: прогностическая система поддержки принятия решений для своевременного прогнозирования поступления в отделение интенсивной терапии», ICML 2016.

[11] Эстева, А., Купрел, Б., Новоа, Р. и др. Классификация рака кожи на уровне дерматологов с использованием глубоких нейронных сетей. Природа 542, 115–118 (2017). Https://doi.org/10.1038/nature21056

[12] Сегеди, Кристиан, Винсент Ванхаук, Сергей Иоффе, Йон Шленс и Збигнев Война. «Переосмысление начальной архитектуры компьютерного зрения». В Труды конференции IEEE по компьютерному зрению и распознаванию образов, стр. 2818–2826. 2016 г.

[13] Хинтон, Джеффри, Нитиш Шривастава и Кевин Сверски. «Нейронные сети для машинного обучения, лекция 6, обзор мини-пакетного градиентного спуска». Цитировано 14, вып. 8 (2012).

[14] Абади, Мартин, Пол Бархам, Цзянмин Чен, Чжифенг Чен, Энди Дэвис, Джеффри Дин, Матье Девин и другие. «Tensorflow: система для крупномасштабного машинного обучения». В 12-м симпозиуме {USENIX} по разработке и внедрению операционных систем ({OSDI} 16), стр. 265–283. 2016 г.

[15] ОЭСР, Read.oecd-ilibrary.org, 2020. [Онлайн]. Доступно: https://read.oecd-ilibrary.org/view/?ref=130_130771-3jtyra9uoh&title=Using-artificial-intelligence-to-help-combat-COVID-19. [Доступ: 29 мая 2020 г.].

[16] Чар, Дантон С., Нигам Х. Шах и Дэвид Магнус. «Внедрение машинного обучения в здравоохранение - решение этических проблем». Медицинский журнал Новой Англии 378, no. 11 (2018): 981.