В начале 24 апреля наша команда приступила к сбору данных (reathforscience.com ) для сбора данных о дыхании / кашле для изучения взаимосвязи между типами дыхания и определенными условиями дыхания.

Исследование преследует две основные цели: 1) оценить эффективность данных о дыхании / кашле, собранных по телефону, 2) если (большой ЕСЛИ) данные полезны, могут ли они помочь нам в построении моделей, помогающих отмечать возможные случаи респираторных заболеваний, таких как астма, пневмония или, что более важно, COVID-19.

Пожалуйста, примите участие

Прежде чем мы объясним исследование и мотивацию исследования, мы хотим призвать вас принять участие, особенно если у вас есть симптомы COVID19 или официальный диагноз!

Зайдите на diverheforscience.com, чтобы отправить образец!

Шумные телефоны

Сбор данных о дыхании / кашле по телефону при использовании в медицинских целях необходимо тщательно изучить, чтобы оценить возможные подводные камни. Представьте, что мы собираем данные от группы с астмой (A) и от группы без (B). Эти данные используются для обучения алгоритма прогнозирования астмы, и алгоритм узнает, что если вы из группы A, у вас астма, а если вы из группы B, то нет.

Теперь вы обнаружите, что все данные, собранные в группе A, были сделаны на дешевых телефонах Nokia за 5 долларов, а группа B использовала iPhone. Алгоритм может НЕ предсказывать астму, а вместо этого предсказывает тип телефона, который использовался для звонка, и в этом случае алгоритм может иметь социально-экономический уклон.

На самом деле, многие другие факторы, такие как погода, время суток, близость к телефонной линии и т. Д., Могут повлиять на качество этих записей. Вот почему нам необходимо изучить жизнеспособность таких методов сбора данных с помощью телефонов.

Модели прогнозирования AI

Допустим, наши медицинские сотрудники действительно решили, что в записях есть интересная информация, которая может быть полезна. В нашем случае анализ, проведенный нашим коллегой Dr. Мири предполагает, что записи могут быть очень полезными.

В этом случае мы могли бы изучить способы помочь врачам автоматизировать этот анализ, который в противном случае им пришлось бы выполнять вручную. Один из конкретных подходов - использовать модели искусственного интеллекта, которые могут оказаться полезными для врачей.

Эти типы моделей уже доказали свою полезность при обнаружении рака груди по изображениям (Wu et al, 2019) или диагностике глазных заболеваний (De Fauw et al, 2018). Однако имейте в виду, что мы говорим не только о модели прогнозирования ИИ. ИИ может предоставить очень полезные данные для врачей, которые могут использовать другую информацию для постановки обоснованного диагноза. Использование только ИИ вряд ли будет работать хорошо и принесет больше вреда, чем пользы.

Исторический диагноз по паттернам дыхания

Одним из основных мотивов использования паттернов дыхания является то, что это уже один физический знак, используемый врачами для респираторных исследований [1, 5]. Фактически, распространенным методом диагностики пневмонии является аускультация, при которой врач прослушивает легкие с помощью стетоскопа [11, 12].

Чтобы проиллюстрировать это, вот пример обычного дыхания, слышимого через стетоскоп.

А вот пример астмы, услышанной через стетоскоп.

Эти методы подкреплены исследованиями, которые показывают, что модели дыхания демонстрируют диагностические различия между здоровыми пациентами и пациентами с респираторными заболеваниями [2, 3, 4, 6, 7].

Удаленная диагностика

Основная мотивация этого исследования состоит в том, чтобы демократизировать возможность диагностики и тестирования в тех местах в мире, где нет хорошего здравоохранения или целых армий хорошо подготовленных врачей. Такая возможность была бы очень полезна в таких местах, как отдаленные горные поселения в Латинской Америке. Но более применимый к сегодняшнему климату, он мог бы использоваться правительствами для проверки всего населения за один день.

Респираторные заболевания являются идеальными кандидатами для этого типа исследований, поскольку их можно зафиксировать удаленно, без какого-либо физического контакта между пациентом и врачом. Например, основная проблема с оценкой истинного числа инфицированных людей или лиц, у которых есть подозрение на COVID-19, заключается в том, что у нас не хватает наборов для тестирования или центров тестирования.

На самом деле, уже есть многочисленные попытки, которые дают первые надежды. В частности, это приложение для смартфонов, которое предположительно использует звук дыхания для обнаружения различных респираторных заболеваний, разработанное ResApp Health. Система продемонстрировала свой потенциал в прошлом году в ходе клинических испытаний.

Эти результаты клинических испытаний, более ранние исследования и текущие исследования подтверждают, что модели дыхания обеспечивают ценную информацию о состоянии легочных функций человека [8, 9, 10].

Второе преимущество удаленной диагностики заключается в том, что бесконтактный контроль дыхания особенно полезен при инфекционных заболеваниях, таких как вирусная пневмония, вызванная, например, вирусами гриппа и коронавирусом.

Выпуск данных

Наша цель - сделать данные, которые мы собираем через http://breatheforscience.com/, доступными для исследователей со всего мира. Однако прежде чем мы это сделаем, мы хотим принять несколько важных мер предосторожности.

  1. Мы хотим убедиться, что сбор данных о дыхании / кашле по телефону не искажает и не искажает данные непредвиденным образом.
  2. Что сами данные несут информацию, которая может быть полезна для врачей или даже для автоматизированных моделей прогнозирования.

В случае, если наша команда и медицинские сотрудники согласятся, что данные соответствуют вышеуказанным критериям, мы предпримем дополнительные шаги для удаления любой информации, которая может быть использована для идентификации участников.

Когда мы выпустим данные, у нас будут сопутствующие загрузчики данных PyTorch и шаблоны моделей PyTorch Lightning для анализа.

Сообщение участникам

Мы очень позаботились о том, чтобы наша система была максимально безопасной. Фактически, мы даже не собираем никакой информации, которая могла бы использоваться для личной идентификации какого-либо участника.

Наиболее важные данные (ваш номер телефона) хешируются с использованием надежного алгоритма шифрования (sha512), который мы храним с каждой записью, чтобы связать пользователей между записями. Это означает, что даже мы не можем определить ваш номер телефона по этому хешу.

Вот пример такого хеширования:

Мы храним длинную строку, которая не может быть преобразована в исходный номер телефона.