Симптомы никогда не лгут, — сказал доктор Хаус, самый блестящий диагност всех времен, существовавший, увы, только на экранах телевизоров. В реальной жизни симптомы часто сложно обнаружить даже лучшим специалистам, а диагностические ошибки признаются как самые частые и вредные медицинские ошибки, и от 12 до 18 миллионов американцев ежегодно сталкиваются с тем или иным неправильным диагнозом.

Есть надежда, что искусственный интеллект (ИИ) и машинное обучение (МО) смогут изменить эту тревожную ситуацию к лучшему. В этой статье освещаются наиболее успешные примеры применения машинного обучения в диагностике, подчеркивается его потенциал и описываются существующие ограничения.

ИИ в обнаружении болезней: текущее положение вещей

В 2016 году Джеффри Хинтон, известный ученый-компьютерщик, которого часто называют «крестным отцом глубокого обучения», который радиологи — специалисты, которые диагностируют заболевания с помощью медицинских изображений, таких как рентген, компьютерная томография (КТ) и магнитно-резонансная томография (МРТ), — будут скоро потеряют работу. «Люди должны прекратить обучать рентгенологов прямо сейчас, объявил он, «очевидно, что через пять лет глубокое обучение будет работать лучше, чем люди».

Четыре года спустя глубокое обучение остается наиболее многообещающим и широко используемым методом машинного обучения для радиологии в частности и диагностики заболеваний в целом. Это неудивительно, поскольку диагностическая визуализация преобладает в клинической диагностике, а распознавание изображений естественным образом подходит для алгоритмов глубокого обучения. Это то, что они умеют делать лучше всего.

Однако не менее очевидно, что машины все же не могут заменить живых экспертов. Вы видите, что [глубокое обучение] используется для поддержки врачей или для предварительного выбора и определения приоритетов случаев, если в очереди много пациентов, описывает реальную ситуацию Эрвин Бретчер, консультант по здравоохранению в Заключении, который, помимо прочего, консультирует бизнес по вопросам искусственного интеллекта.

Есть несколько факторов, которые способствуют использованию глубокого обучения в радиологии и других диагностических практиках:

  • продолжающийся рост вычислительной мощности и технологий хранения,
  • снижение стоимости оборудования,
  • рост стоимости медицинских услуг,
  • нехватка медицинских работников и
  • обилие медицинских данных для обучения моделей. Только в США ежегодно генерируется 60 миллиардов рентгенологических изображений, не говоря уже о других данных.

Сегодня большинство алгоритмов глубокого обучения дополняют диагностический рабочий процесс, но ни в коем случае не заменяют специалистов-людей. Ниже мы рассмотрим наиболее перспективные варианты использования ИИ в здравоохранении и приведем примеры решений на основе машинного обучения, коммерчески доступных в Северной Америке (одобрено FDA), Европе (с маркировкой CE) или в обеих странах.

Скрининг рака молочной железы

По данным Всемирной организации здравоохранения (ВОЗ), рак молочной железы является наиболее распространенным онкологическим заболеванием среди женщин, от которого ежегодно умирает около 627 000 человек. Для спасения жизней многие страны ввели программы скрининга, направленные на выявление рака на ранней стадии.

Процедуры варьируются от страны к стране. Например, американки проходят маммографию (рентген груди) каждые один-два года, и каждое изображение анализируется одним рентгенологом. Британские женщины проходят обследование раз в три года, но результаты дают два эксперта. Хотя ни один из подходов не идеален, двойное чтение показывает лучшую точность.

Развитие ИИ и обещанные преимущества

В самом начале 2020 года подразделение искусственного интеллекта Google DeepMind представило модель глубокого обучения, которая, как сообщается, улучшила результаты среднего рентгенолога на 11,5% и значительно снизила нагрузку на второго читателя в британском сценарии.

Другое недавнее исследование, проведенное корейскими академическими больницами, показало, что ИИ обладает более высокой чувствительностью в обнаружении рака по сравнению с экспертами-людьми, особенно при работе с жирной грудью (90% против 78%).

Исследования все еще находятся на ранних стадиях, и необходимы дополнительные клинические испытания. На данный момент модели могут служить дополнительным читателем для автоматического формирования второго мнения. Потенциально они восполнят растущую нехватку подготовленных рентгенологов.

Коммерчески доступные решения

Решения для здоровья груди от iCAD (базируется в Нью-Гемпшире, США, одобрено FDA, имеет маркировку CE). Набор ИИ применяет алгоритмы глубокого обучения к 2D-маммографии, 3D-маммографии (цифровой томосинтез груди или DBT) и оценке плотности груди. Его технология ProFound AI стала первым решением искусственного интеллекта для 3D-маммографии, одобренным FDA.

Transpara компании ScreenPoint Medical (Нидерланды, одобрено FDA, имеет маркировку CE). Алгоритм глубокого обучения Transpara, обученный на более чем миллионе маммограмм, помогает радиологам анализировать как 2D, так и 3D маммограммы. Решение уже используется в 15 странах, включая США, Францию ​​и Турцию.

Раннее выявление меланомы

Заболевания кожи являются четвертой по частоте причиной инвалидности в мире, тогда как рак кожи является самой распространенной злокачественной опухолью в мире, поражая 20 процентов людей к 70 годам. К счастью, 99 процентов случаев излечимы, если их вовремя обнаружить и лечить. время. И именно здесь ИИ может сыграть значимую роль. Подобно радиологам, дерматологи в значительной степени полагаются на визуальное распознавание образов.

Развитие ИИ и обещанные преимущества

В 2017 году компьютерщики из Стэнфордского университета создали модель сверточной нейронной сети (CNN), которая была обучена на 130 000 клинических изображений кожных патологий для выявления рака. Алгоритм дошел до точности, продемонстрированной дерматологами.

Год спустя Европейское общество медицинской онкологии (ESMO) показало еще лучшие результаты: CNN правильно определила меланому в 95 процентах случаев, тогда как точность дерматологов составила 86,6 процента.

Наконец, в марте 2020 года журнал Investigative Dermatology опубликовал исследование ученых из Сеульского национального университета. Их модель CNN научилась на основе более чем 220 000 изображений предсказывать злокачественные новообразования и классифицировать 134 кожных заболевания. Опять же, ИИ доказал свою способность различать меланому и родимые пятна на экспертном уровне.

Помимо повышения скорости и точности диагностики, планируется запустить алгоритмы CNN на смартфонах для непрофессиональных обследований кожи. Это может побудить людей посещать дерматолога по поводу поражений, которые в противном случае можно было бы проигнорировать.

Коммерчески доступные решения

Несмотря на все многообещающие исследования, ни одно программное обеспечение для обнаружения рака кожи с использованием ИИ в настоящее время не разрешено FDA для продажи в Северной Америке из-за потенциального вреда от плохой диагностики. В то же время два раствора для выявления меланомы имеют маркировку CE, что означает соответствие европейским стандартам безопасности.

SkinVision (базируется в Нидерландах, имеет маркировку CE). Приложение предназначено для оценки риска развития рака на основе фотографий подозрительных родинок или других отметин. Его алгоритм искусственного интеллекта был обучен обнаруживать предупреждающие знаки на 3,5 миллионах изображений. SkinVision уже помог диагностировать 40 000 случаев рака кожи. Приложение доступно для iOS и Android по всему миру, кроме США и Канады. Однако она ни в коем случае не может заменить визит к дерматологу.

skinScan от TeleSkin ApS (базируется в Дании, имеет маркировку CE). Приложение для iOS, доступное для загрузки в Скандинавии, Новой Зеландии и Австралии, использует алгоритм ИИ, чтобы отличить типичную родинку от нетипичной.

Скрининг рака легких

Рак легкого — самое смертоносное онкологическое заболевание в мире: он лидирует в списке смертности от онкологических заболеваний и уступает по распространенности только раку кожи. Как и в случае с другими злокачественными новообразованиями, раннее выявление может спасти жизнь. К сожалению, симптомы рака легкого очень похожи на симптомы пневмонии или бронхита. И именно поэтому его выявляют только на запущенных стадиях примерно в 70 процентах случаев.

Развитие ИИ и обещанные преимущества

Исследование Google, проведенное в 2019 году, показало многообещающий результат: модель глубокого обучения, созданная в сотрудничестве с Northwestern Medicine и обученная на 42 000 КТ грудной клетки, лучше диагностировала рак легких, чем рентгенологи с восьмилетним опытом. Алгоритм смог обнаружить злокачественные формы легких на 5–9,5% чаще, чем люди-специалисты. Ранее другая модель CNN доказала свою способность выявлять хроническую обструктивную болезнь легких (ХОБЛ), которая часто перерастает в рак.

Скорее всего, вскоре системы ИИ помогут радиологам анализировать большое количество изображений КТ, что будет способствовать успешному лечению и увеличению выживаемости.

Коммерчески доступные решения

Veye Chest от Aidense (Нидерланды, маркировка CE). Решение ИИ автоматически обнаруживает подозрительные узлы в легких по результатам компьютерной томографии с низкой дозой облучения, измеряет их и сравнивает с предыдущими изображениями, чтобы определить скорость роста.

ClariCT.AI компании ClariPi (Южная Корея, одобрено FDA). Это решение не выявляет рак, но снижает уровень шума при КТ с низкой и сверхнизкой дозой облучения, что повышает доверие рентгенологов. Модель CNN была обучена на более чем миллионе изображений различных частей тела, но ClariPi делает акцент на скрининге рака легких как на ключевом применении своего алгоритма.

Скрининг диабетической ретинопатии

В области офтальмологии ИИ в основном используется для анализа изображений сетчатки глаза и, в частности, для обнаружения диабетической ретинопатии (ДР). Это глазное осложнение может привести к слепоте и поражает каждого третьего пациента с диабетом, что составляет 422 миллиона человек во всем мире. Раннее выявление предотвращает риск потери зрения. Но проблема в том, что ДР часто не проявляет симптомов до тех пор, пока ее не станет трудно лечить.

Развитие ИИ и обещанные преимущества

Технология глубокого обучения IBM, запущенная в 2017 году, достигла 86-процентной точности при обнаружении ДР и классификации ее серьезности — от легкой до пролиферативной.

Этот результат превзошел Google. В сотрудничестве со своей родственной организацией Verily технический гигант в течение трех лет обучал глубокую нейронную сеть, используя набор данных из 128 000 изображений сетчатки глаза. В 2018 году AI Eye Doctor от Google продемонстрировал 98,6-процентную точность, наравне с людьми-экспертами. Теперь алгоритм служит в помощь врачам глазной больницы Аравинд в Индии.

Ввиду растущего числа людей с диабетом системы скрининга на основе ИИ могут снизить нагрузку на глазных техников и офтальмологов. Раннее выявление также означает удешевление лечения: стоимость препарата при тяжелой патологии может возрасти более чем в десять раз по сравнению с лечением на ранней стадии.

Коммерчески доступные решения

IDx-DR компании IDx (штат Айова, США, одобрено FDA, имеет маркировку CE). Программное обеспечение IDx-DR, известное как первая система искусственного интеллекта для диагностики DR, одобренная FDA, может быть сопряжена только с определенной ретинальной камерой под названием Topcon. Алгоритм глубокого обучения дает один из двух результатов:

1) посетить офтальмолога (при ДР более легкой степени) или

2) повторный скрининг через 12 месяцев (при легких и отрицательных результатах).

IRIS (базируется во Флориде, США, одобрено FDA). Интеллектуальные системы визуализации сетчатки могут работать с разными камерами, поскольку они автоматически улучшают качество исходных изображений. Компания получает выгоду от Microsoft Azure Machine Learning Package для компьютерного зрения.

Оценка сердечного риска по электрокардиограммам (ЭКГ)

Болезни сердца являются причиной смерти номер один среди мужчин и женщин в США и во всем мире. Своевременная оценка риска на основе ЭКГ — самого быстрого и простого теста сердечной деятельности — может значительно снизить смертность и предотвратить сердечные приступы.

Развитие ИИ и обещанные преимущества

Ежегодно во всем мире создается более 300 миллионов ЭКГ, поэтому алгоритмы получают огромный объем данных для обучения. Многочисленные исследования показывают, что ИИ уже не только выявляет текущие аномалии на ЭКГ, но и предсказывает будущие риски. Например, разработанная в 2019 году в Массачусетском технологическом институте технология РискКардио оценивает вероятность смерти от сердечно-сосудистых заболеваний в течение 30–365 дней у пациентов, уже перенесших острый коронарный синдром (ОКС).

В свою очередь, группа исследователей из Медицинского центра Гейзингера использовала более двух миллионов ЭКГ для обучения глубоких нейронных сетей, чтобы точно определять пациентов с более высоким риском смерти в течение года. Ключевой вывод заключается в том, что алгоритмы смогли распознать модели риска, которые упускают из виду кардиологи.

Ожидается, что искусственный интеллект сэкономит значительное время специалистам-людям и уменьшит количество ошибочных диагнозов. В сочетании с недорогим оборудованием алгоритмы глубокого обучения потенциально могут позволить использовать ЭКГ в качестве диагностического инструмента в местах, где кардиологи редки или отсутствуют.

Коммерчески доступное решение

КардиаМобайл компании AliveCor (штаб-квартира в Калифорнии, США, одобрено FDA, имеет маркировку CE). Персональное решение для ЭКГ состоит из небольшого записывающего устройства, которое записывает ЭКГ за 30 секунд, и мобильного приложения, использующего глубокую нейронную сеть для обнаружения медленных и быстрых сердечных ритмов (брадикардия и тахикардия), мерцательной аритмии (ФП) и нормальных ритмов. После записи ЭКГ можно отправить врачу для дальнейшего анализа.

Ранняя диагностика инсульта по КТ головы

Инсульт или внезапная гибель клеток головного мозга из-за нехватки кислорода является второй основной причиной смерти и третьей ведущей причиной длительной нетрудоспособности во всем мире. Это опасное состояние требует немедленной диагностики и лечения: статистика показывает, что пациенты, получившие профессиональную помощь в течение трех часов после появления первых симптомов, как правило, лучше и быстрее выздоравливают. Но, к сожалению, работники скорой медицинской помощи (СМП) упускают из виду примерно 15 процентов инсультов, что приводит к задержкам в оказании неотложной помощи и увеличивает риск летальных исходов.

Развитие ИИ и обещанные преимущества

Ученые из Geisinger собрали более 46 000 КТ головного мозга, чтобы создать модель, способную маркировать признаки внутримозгового кровоизлияния (ВМК) — самого смертоносного типа инсульта с 40-процентной смертностью в течение 30 дней и тяжелой инвалидностью у большинства выживших. Они внедрили алгоритм в рутинную помощь и тестировали его в течение трех месяцев. В некоторых случаях это приводило к сокращению времени диагностики на 96 процентов. Исследователи также сообщили о способности алгоритма обнаруживать тонкие симптомы ВМК, пропущенные радиологами.

Согласно множественным исследованиям, ИИ также может успешно применяться для диагностики ишемического инсульта, вызванного окклюзией крупных сосудов или ЛВО. А эксперименты с Обучаемой машиной Google показали, что обученные алгоритмы правильно определяют тип инсульта в 77,4 процентах случаев.

Потенциально ИИ, обученный нейрорадиологами, может давать надежное «второе мнение» неопытным поставщикам медицинских услуг, чтобы они могли быстро принимать решения и минимизировать ущерб.

Коммерчески доступные решения

Viz LVO и Viz-ICH компании Viz.ai (базируется в Калифорнии, США и Израиле, одобрено FDA и имеет маркировку CE). Алгоритмы глубокого обучения анализируют компьютерную томографию для выявления предполагаемых инсультов ICH и LVO. Система автоматически оповещает специалистов, экономя драгоценное время и мозговые клетки.

AI Stroke от Aidoc (базируется в Израиле, одобрен FDA и имеет маркировку CE). Пакет AI Stroke охватывает два типа инсульта — ICH и LVO. Система автоматически помечает подозрительные случаи, позволяя радиологам быстро принять решение о дальнейших действиях.

e-Stroke Suite от Brainomix (Великобритания, маркировка CE). Программное обеспечение для обработки изображений, управляемое искусственным интеллектом, автоматически оценивает компьютерную томографию пациентов, перенесших инсульт. В настоящее время алгоритм определяет только ишемический инсульт, что составляет 85 процентов всех случаев.

Препятствия для внедрения ОД в здравоохранение

Использование ИИ в диагностическом рабочем процессе могло бы быть намного шире, если бы не несколько препятствий. Что тормозит внедрение ИИ в медицинскую диагностику? Первое, что приходит на ум, — это деньги: ML-проекты затратны, трудоемки и требуют огромных вычислительных ресурсов. Медицинские учреждения часто работают в условиях ограниченного бюджета, в то время как потенциальные инвесторы могут сомневаться в будущей рентабельности ввиду нехватки проверенных вариантов использования.

Но помимо финансовых проблем, которые являются общими для многих областей, сектор здравоохранения добавляет отраслевые уровни сложности.

Регуляторные вопросы

Программное обеспечение, предназначенное для диагностических целей, регулируется строгими правилами, обеспечивающими безопасность пациентов. Чтобы продавать решения на основе ИИ в Европе, компании необходимо получить знак CE (Conformité Européenne), а для выхода на рынок США требуется разрешение FDA (Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США). В обоих случаях процесс сертификации требует много времени, денег и энергии, требуя клинических испытаний, оценок и тонн технической документации. Это может стать серьезной проблемой для малого бизнеса и стартапов.

Нехватка данных о новых заболеваниях

Подавляющее большинство болезней существуют десятилетиями и веками, о них накоплены горы данных. Тем не менее, это не относится к новым инфекциям, таким как COVID-19. Нехватка больших наборов данных — ключевая причина, по которой машинное обучение пока не эффективно для отслеживания симптомов коронавируса.

Почему большое количество данных так важно для успеха алгоритмов машинного обучения? Грубо говоря, чем больше изображений патологии вы пропустите через машину на этапе обучения, тем лучше она сможет самостоятельно распознавать определенные аномалии. Что касается коронавируса, нынешнее отсутствие исторических данных усугубляется другой, более постоянной проблемой — ограничениями на обмен медицинской информацией.

Хранилища данных и правила конфиденциальности

Чаще всего больницы и научно-исследовательские институты хранят медицинские данные разрозненными и разделенными, вне досягаемости научного сообщества. Эта фрагментация дополнительно поддерживается правилами защиты данных, такими как GDPR или HIPAA, которые накладывают ограничения на обмен информацией о пациентах. Идея централизации конфиденциальных данных на облачном сервере, доступном для технологических компаний, крайне непопулярна в США, Великобритании и других странах.

Чтобы решить проблему конфиденциальности, Google предложил новый подход, названный федеративным обучением. Он позволяет обучать текущий алгоритм в разных больницах, используя локальные наборы данных. Затем обновления отправляются в центральное хранилище для улучшения общей модели. Таким образом, учреждения обмениваются моделями, а не конфиденциальными данными. Однако метод конфиденциальности не лишен подводных камней. Например, требуется, чтобы больницы имели инфраструктуру и персонал, способный обучать модели.

Отсутствие стандартизации

Даже если бы медицинские записи были открыты для общественности, это не решило бы проблемы качества и стандартизации. Медицинская информация собирается во многих форматах, причем стандарты сильно различаются в разных организациях. Таким образом, ученым требуется много времени, чтобы очистить и пометить данные, прежде чем передавать их в модели.

Аспект черного ящика и отсутствие доверия

Как правило, алгоритмы глубокого обучения работают как черные ящики: они не объясняют, почему они делают поспешные выводы. Хотя во многих областях отсутствие интерпретируемости не является проблемой, оно, безусловно, имеет значение в здравоохранении, где на карту поставлены жизни людей. Клиницисты и их пациенты должны знать, что заставляет машину выносить свои вердикты и есть ли за ними доказательства. В противном случае они вряд ли смогут полагаться на диагнозы, предлагаемые ИТ-системами.

Чтобы убедительно проиллюстрировать проблему, Эрвин Бретшер приводит пример проекта по выявлению кардиомиопатии, заболевания сердечной мышцы, по диагностическим изображениям. «Аномалия распознается [машинами]»,объясняет он, «Однако специалисты часто видят проблему на сканах, где вроде бы все в порядке. И чаще всего они правы! Это подводит меня к вопросу: может ли компьютер заменить человеческую интуицию? И кто несет ответственность за результат?»

В долгосрочной перспективе проблему доверия можно решить с помощью так называемого объяснимого ИИ (XAI) — новой области машинного обучения, целью которой является предоставление экспертам в предметной области четких обоснований результатов, полученных с помощью моделей.

Решения XAI, разрабатываемые в настоящее время, просты и находят ограниченное применение. Тем не менее ожидается, что такие алгоритмы в конечном итоге будут доминировать в здравоохранении, поскольку они обеспечивают прозрачность процессов принятия решений.

AI vs MD: кто здесь главный?

Человеческий мозг — даже такого гения, как доктор Хаус, — имеет ограничения по объему данных, которые он может хранить и обрабатывать. ИИ может решить эту проблему, ускорив диагностику и лечение. С помощью интеллектуальных алгоритмов врачи получают «вторую пару глаз» для обнаружения проблемы, которую можно не заметить из-за усталости, отвлекающих факторов, отсутствия опыта или других человеческих факторов.

«ИИ может уменьшить нагрузку на системы здравоохранения»,добавляет Эрвин Бретчер. «Во многих странах население стареет и требует большего ухода, но сектор не может расти одинаково».

В ближайшие годы мы увидим больше диагностических решений, использующих алгоритмы глубокого обучения, которые значительно улучшат уход за пациентами. Но кто будет принимать окончательное решение и нести ответственность? Судя по всему, живой профессионал: AI еще слишком молод для этого.

Первоначально опубликовано в техническом блоге AltexSoft Глубокое обучение в медицинской диагностике: как искусственный интеллект спасает жизни и сокращает расходы на лечение