НЛП — это область искусственного интеллекта, которая занимается взаимодействием между компьютерами и людьми с использованием естественного языка. Конечная цель НЛП состоит в том, чтобы читать, понимать и осмысливать человеческие языки таким образом, чтобы это было ценно. Понятно, что из-за сложности естественных языков это трудная задача. Это связано с тем, что всестороннее понимание любого языка предполагает понимание того, как слова и понятия связаны для передачи сообщения.

Основными методами, используемыми для извлечения информации из человеческого языка, являются синтаксический анализ и семантический анализ. Синтаксический анализ основан на синтаксисе предложений и используется для оценки того, соответствует ли язык грамматическим правилам. Семантический анализ относится к семантике предложений — смыслу, передаваемому текстом. Понятно, что семантический анализ является более сложным из двух, поскольку включает в себя включение абстрактных языковых понятий вместо фиксированных грамматических правил.

К повседневным примерам НЛП относятся интеллектуальные помощники, такие как Siri и Cortana,предсказуемый текст, такой как автозамена или автозаполнение, и языковой перевод, такой как Google Translate. Все эти примеры включают обработку человеческого языка, будь то в текстовом или звуковом формате, для извлечения ценной информации и выполнения определенной операции с этой информацией. Как вы думаете, как этот метод можно применить в сфере здравоохранения?

Применение НЛП в медицине

Распознавание речи для клинической документации

Опрос, проведенный среди 4 720 врачей, работающих в сфере непосредственной помощи пациентам в США, показал, что в среднем врач тратит на администрирование 8,7 часа в неделю. Это администрирование включает транскрипцию записей пациентов в данные электронной медицинской карты (EHR). Применение распознавания речи в секторе здравоохранения позволило медицинским работникам быстро расшифровывать заметки для ввода полезных данных EHR. Точная, адаптированная с медицинской точки зрения транскрипция заметок высвобождает время медицинских работников, позволяя им проводить больше времени с пациентами, повышая эффективность работы врача.

Система распознавания речи, обученная на более чем 270 часах медицинских речевых данных и 30 миллионах токенов текста, была способна расшифровывать речь с частотой ошибок ниже 16% в клиническом случае — уровень ошибок аналогичен тому, что делают транскрипторы-люди. Применение алгоритмов глубокого обучения к этим системам может привести к значительному повышению точности и скорости.

Медицинские записи пациентов и расстановка приоритетов

Медицинская сортировка относится к процессу определения приоритетности потребностей пациентов в помощи в больнице или на догоспитальном этапе. Из-за невероятной нагрузки, с которой сталкиваются врачи, понятно, что им необходимо расставлять пациентов по степени тяжести. Несколько компаний, таких как Babylon Health, Health Tap и Your.MD, разработали ИИ-врачей. Эти службы предоставляют медицинские консультации пациентам с общими симптомами, освобождая доступ к первичной медицинской помощи для более сложных случаев. Вавилон, в частности, сообщил о диагностической точности, сравнимой с точностью врачей-людей.

Эти сервисы неизменно используют НЛП для расшифровки входных данных пациента в полезную информацию, которая может быть передана в другие модели машинного обучения для диагностики. Эти системы направлены на удовлетворение потребностей как пациентов, так и врачей. Пациенты, которым требуется внимание врачей для малоприоритетной помощи, могут воспользоваться этими услугами по запросу. В конечном итоге это снижает нагрузку на врачей, позволяя им уделять больше времени приоритетным пациентам.

Обработка медицинской документации и литературы

Электронное хранение медицинских карт, EHR, стало стандартом во многих больницах. Сбор медицинских данных в стандартизированном формате поможет повысить эффективность больниц, улучшить результаты лечения пациентов и снизить выгорание врачей. Однако важным шагом в этом процессе является перевод существующей физической документации в электронную форму.

Подобно применению НЛП для распознавания речи для клинической документации, НЛП можно использовать для этого приложения. Это позволит быстро сканировать и интегрировать медицинскую информацию в электронную базу данных. После оцифровки эти данные могут использоваться для различных других целей, таких как врачи при лечении пациентов, для исследований или для разработки других моделей машинного обучения, которые можно применять в клинической среде.

НЛП в медицинских исследованиях

В предыдущих примерах в основном обсуждалось применение НЛП для решения административных задач в сфере здравоохранения. Однако НЛП также обладает значительными возможностями для улучшения медицины и медицинских исследований. Различные исследования с использованием НЛП для предсказания конкретных состояний были выполнены с отличными результатами.

Обнаружение легочной эмболии

В 2020 году было проведено исследование для изучения возможностей НЛП в выявлении событий легочной эмболии (ТЭЛА) по сравнению с используемыми в настоящее время кодами МКБ-10. 1000 случайно выбранных обращений за медицинской помощью с КТ легочной ангиограммой были рассмотрены и представлены двумя независимыми наблюдателями. Для отчетов были выполнены НЛП, коды МКБ-10 и ручной просмотр отчетов, и результаты были сравнены. События ТЭЛА были обнаружены в 13% сообщений. НЛП было способно превзойти МКБ-10 по чувствительности, 96% по сравнению с 92,9%, и специфичности 97,7% по сравнению с 91% в МКБ-10.

Хирургия рака яичников

Другое исследование было направлено на использование НЛП для прогнозирования исхода операции по поводу рака яичников. В частности, определить, улучшает ли НЛП (с машинным обучением) предоперационных компьютерных томограмм способность прогнозировать послеоперационные осложнения и повторную госпитализацию по сравнению с предикторами только с дискретными данными. Результаты показали, что использование только дискретных признаков позволило прогнозировать послеоперационную предгоспитализацию с площадью под кривой (AUC) 0,56. Это улучшилось до 0,70 с добавлением НЛП предоперационных КТ.

Прогноз цирроза печени

Исследование применяло НЛП в качестве дополнения к кодам МКБ-9 и лабораторным значениям для лучшего определения и стратификации риска у пациентов с циррозом печени. НЛП было применено к 5 343 пациентам первичного звена с кодами МКБ-9, указывающими на хроническое заболевание печени. 168 из них были проверены вручную случайным образом в качестве эталона. Алгоритм работал с положительной прогностической ценностью (PPV), отрицательной прогностической ценностью (NPV), чувствительностью и специфичностью 91,78%, 96,84%, 95,71% и 93,88% соответственно. В исследовании говорится, что компонент НЛП алгоритма был наиболее важным. Этот раздел выполнен с PPV, NPV, чувствительностью и специфичностью 98,44%, 93,27%, 90,00% и 98,98% соответственно.

Ограничения НЛП

Хотя НЛП предлагает значительный потенциал для развития в секторе здравоохранения, это не обходится без проблем.

Предвзятость в обучении машинному обучению

Модели машинного обучения, хотя и объективны, являются продуктом данных, которые используются для их обучения. В результате смещения в обучающих данных приводят к искажениям в моделях машинного обучения, и модели НЛП не являются исключением. Эти смещения являются результатом обучающих наборов, которые не полностью репрезентативны для интересующей совокупности, содержат отсутствующие или неправильно классифицированные данные и ошибки измерения. Улучшение представления населения в данных EHR поможет уменьшить погрешность модели и улучшить ее производительность в целом.

Обучение по результатам

Обучение модели НЛП включает в себя определение результатов, по которым модель может проверяться. Как только результаты установлены, модель проверяется на ее способность предсказывать эти конкретные результаты. Это эффективно, когда определены конкретные результаты, но ясно, что это имеет ограничения для прогнозирования долгосрочных факторов риска, связанных с хроническими заболеваниями.

Несоответствия в тексте медицинской документации

Большое количество приложений NLP, обсуждавшихся выше, включают обучение модели на данных EHR. Чтобы обеспечить точность модели, эти данные EHR должны быть как можно более согласованными. Однако из-за характера свободного текста, используемого для описания взаимодействий с пациентами и оценок, может существовать большое количество вариаций. Это особенно очевидно между различными медицинскими специализациями и профессионалами. Стандартизация этих отчетов поможет в разработке моделей и их точности. SNOMED-CT был принят в качестве стандартного словаря среди членов NHS. Возникающая в результате проблема, однако, заключается в том, чтобы позволить врачам описывать пациенту тонкости и запутанности, используя высоко структурированный словарь.

Вывод

НЛП может оказать значительное влияние на сектор здравоохранения. Он может сократить количество времени, которое врачи тратят на административные задачи, снизить нагрузку на врачей пациентов с низким уровнем риска, а также помочь в медицинских исследованиях. Однако этот потенциал значительных изменений не обходится без проблем. Разработка этих моделей зависит от предвзятости модели, строгих результатов и несоответствия необработанных данных. Ответственность за учет этих факторов лежит на тех, кто участвует в разработке моделей, чтобы гарантировать, что эти модели могут применяться ко всей популяции с разумной точностью.

Источники