Внутри ИИ

Введение в машинное обучение в онкологии

О будущем искусственного интеллекта в лечении и исследованиях рака

Последние достижения в онкологии привели к появлению интересных вариантов лечения рака и длительной ремиссии. Однако эффективная и действенная диагностика остается препятствием для своевременного лечения большинства видов рака. Благоприятный прогноз зависит от раннего выявления, но во многих случаях пациенты не знают о своем раке до тех пор, пока не начнут страдать от связанных заболеваний. Патологам нужны более мощные инструменты, чтобы повысить их способность быстро и правильно определять возможные виды рака.

Возможности и проблемы моделей искусственного интеллекта

Развитие искусственного интеллекта может произвести революцию в процессах сбора данных, обработки изображений и последующей диагностики. Машинное обучение (ML) и глубокое обучение - это ветви искусственного интеллекта, которые сосредоточены на выявлении закономерностей в данных и разработке моделей для точного прогнозирования результатов для новой информации. Область медицины представляет уникальные проблемы для моделей машинного обучения. Большая часть данных, особенно из электронных медицинских карт (EHR), неклассифицирована, разрежена или недоступна из-за устаревших систем больниц или нежелания делиться данными. Кроме того, плохо работающая модель имеет далеко идущие последствия и может иметь катастрофические последствия для пациентов. Наконец, чрезвычайная сложность рака и его возможных методов лечения поддается высокоспецифичным и изолированным моделям ML. Например, модель, используемая для обнаружения рака с использованием профиля циркулирующих miRNA, страдала низкой чувствительностью и неспособностью различать доброкачественные и злокачественные опухоли (2). Это говорит о том, что обмен моделями и идеями может быть затруднен как между организациями, так и между разными видами рака.

Модели машинного обучения могут использовать один из трех стилей для понимания вводимых данных. Обучение с учителем - самый простой стиль. Помеченные входные данные подаются в модель, которая использует скрытые слои функций и весов, чтобы узнать, какие преобразования входных данных правильно сопоставляются с метками. Поскольку исходные данные предварительно помечены, точность модели может быть измерена, а модель уточнена. После обучения модель может получать новые данные для прогнозирования. Обучение без учителя не имеет этих определяемых пользователем меток, и модель должна обнаруживать особенности входов, чтобы их можно было сопоставить с выходами. Этот метод требует меньшего вмешательства человека, как положительного, так и отрицательного, потому что модели может быть трудно распознать закономерности или она может использовать произвольные функции, которые имеют небольшую реальную прогностическую силу. Полу-контролируемое обучение использует подмножество предварительно помеченных и немаркированных данных. Это метод, наиболее близкий к тому, как патологоанатомы принимают решение о диагнозе, поскольку у них есть доступ к помеченным данным, таким как ширина или плотность опухоли, а также к немаркированным данным, как и к предыдущим записям. Выбор и извлечение признаков - критическая, трудоемкая часть разработки успешных моделей, о которой мы поговорим в одной из следующих статей.

Приложения искусственного интеллекта в биомедицинских областях

Бурный рост данных с использованием нескольких OMIC, обусловленный достижениями в области секвенирования следующего поколения (NGS) и высокопроизводительных технологий (HTT), сделал геномные и протеомные данные более доступными для исследователей и клиницистов (2). Например, молекулярные биомаркеры оказались очень эффективными для прогнозирования рака, поскольку определенные маркеры, такие как PD-L1 и CTLA-4, сверхэкспрессируются в раковых клетках. Эти данные также могут помочь клиницистам различать подгруппы одного и того же рака и обеспечивать индивидуальное лечение. Если бы модель CNN могла быть обучена идентифицировать эти маркеры из окрашенных гистологических образцов, это могло бы привести к регулярным, дешевым и эффективным скрининговым исследованиям без интенсивной терапии со стороны клинициста.

Клинические данные, такие как записи, медицинские изображения и физиологический мониторинг в реальном времени, хорошо поддаются анализу и прогнозированию с помощью моделей машинного обучения. Для успешной работы с данными этого типа требуется сложная функциональная разработка, поскольку данные о пациентах очень разнородны и их нелегко применить в новом контексте. Как предполагают Ван и Прейнингер, модели глубокого обучения (DL) могут решить эту проблему, создав свои собственные функции. Это может позволить разработать более надежные и точные прогнозы и более индивидуализированное лечение (3). Например, структура, разработанная De Fauw et al. требует использования двух моделей вместе, где первая модель DL анализирует и выбирает функции, которые затем передаются во вторую сверточную нейронную сеть (CNN), которая фактически предсказывает вероятные диагнозы (4).

Моделирование исходов для пациентов также показало некоторый успех в оценке выживаемости и ремиссии рака. Одна такая модель искусственной нейронной сети достигла 83% точности в прогнозировании выживаемости при немелкоклеточном раке легкого (НМРЛ). Однако, как и в случае со многими из этих моделей, он не применим к другим типам рака. Это связано с тем, что несколько генов, специфичных для NSCLC, и их экспрессия использовались в качестве признаков в модели. Может быть трудно разработать общие модели прогнозирования из-за огромного разнообразия векторов рака и полезности конкретных генов для прогнозирования различных видов рака.

Ключевые выводы и следующие шаги

Будущее искусственного интеллекта в медицинских исследованиях и лечении светлое. Хотя в настоящее время модели весьма специфичны; их успехи в этих областях нельзя упускать из виду. По мере того как исследователи и клиницисты становятся доступными для большего количества данных, растет понимание и понимание возможных приложений ИИ, и мы должны ожидать резкого увеличения их использования.

Тем не менее, мы должны остерегаться сенсационного будущего для этих моделей. Несмотря на то, что они эффективны, они также ограничены по своему охвату и должны рассматриваться как еще один инструмент для клиницистов, позволяющий предоставлять пациентам более эффективное и индивидуализированное лечение. Модели искусственного интеллекта способны выявлять аномалии на основе однородного отбора, и эту способность следует использовать превентивно, чтобы направлять патологов к потенциальным проблемам.

Источники

[1] М.С. Копур, Состояние исследований рака во всем мире (2019), Онкология 33 (5): 181–185.

[2] К. Куру, Т.П. Экзархос, К. Exarchos и др., Приложения машинного обучения в прогнозировании и прогнозировании рака (2015), Журнал вычислительной и структурной биотехнологии 13: 8–17.

[3] Ф. Ван и А. Прейнингер, Искусственный интеллект в здравоохранении: современное состояние, проблемы и будущие направления (2019 г.), Международная ассоциация медицинской информатики: Ежегодник медицинской информатики, 16–26.

[4] Дж. Де Фау, Дж. Р. Ледсам, Б. Ромера-Паредес и др., Клинически применимое глубокое обучение для диагностики и направления к специалистам при заболеваниях сетчатки (2018), Nature Medicine 24 (9): 1342–1350.

[5] П. Модадерсани, С. Юсефи, М. Амгад и др., Прогнозирование исходов рака на основе гистологии и геномики с использованием сверточных сетей (2018), PNAS 115 (13): 2970–2979.