Предварительная обработка данных и рабочий процесс на изображениях глазного дна для классификации диабетической ретинопатии

Диабетическая ретинопатия поражает кровеносные сосуды в светочувствительной ткани, называемой сетчаткой, которая выстилает заднюю часть глаза. Это наиболее частая причина потери зрения среди людей с диабетом и основная причина ухудшения зрения и слепоты среди взрослых трудоспособного возраста.

НАБОР ДАННЫХ: набор данных был взят из Kaggle.

Набор данных состоит из 35 000 изображений различных классов и очень несбалансирован.
Обнаруженные данные, относящиеся к этой теме, зашумлены и требуют нескольких шагов предварительной обработки, чтобы привести все изображения в формат, пригодный для обучения модели.
Для каждого предмета предусмотрены левое и правое поля. Изображения помечаются идентификатором объекта, а также слева или справа (например, 1_left.jpeg - это левый глаз пациента с идентификатором 1).
Набор данных был помечен как:

0 - Нет
1 - Легкая
2 - Умеренная
3 - Тяжелая
4 - Пролиферативная

Стратегия предварительной обработки

Использовать изображение в качестве входных данных
Применяйте методы обработки изображений, такие как CLAHE, преобразование оттенков серого, чтобы выделить важные функции.
Обрезка и изменение размера изображений.
Правильная очистка данных и удаление черных изображений.
Вращение и зеркальное отображение изображений для балансировки набора данных.
Преобразование в массив numpy.
Используется для окончательной классификации (тестирование и обучение)

Стратегия обработки изображений

Мы знаем, что некоторые особенности изображений сетчатки являются наиболее важными при обнаружении диабетической ретинопатии, это кровеносные сосуды, экссудаты, кровоизлияния, микроаневризмы.
Это может помочь изолировать функцию, отвечающую за состояние пациента, и может быть предоставлено последующее лечение.
Для извлечения этих особенностей из образцов изображений использовался ряд методов. Для обрезки, изменения размера и увеличения использовались встроенные инструменты библиотеки OpenCV.

Предварительная обработка набора данных

Набор данных сильно несбалансирован. Из-за этого дисбаланса увеличивается вероятность переобучения. Поэтому для устранения этой проблемы перед классификацией изображений были выполнены следующие шаги.

Обрезка: обрезка была сделана как часть предварительной обработки, чтобы классификатор мог обучаться с максимальной скоростью.
Извлечение: для обеспечения модели с лучшими характеристиками. (Как показано выше)
Изменение размера: исходный размер изображений был 3500 * 2500, который был изменен до 256 * 256.
Увеличение: некоторые изображения были повернуты, а также зеркально отражены, чтобы сбалансировать классы и избежать переобучения. Кроме того, это важная часть предварительной обработки данных. Осуществлено 30,60,120,150,270 ротаций.

Модели обучения

Используемые обучающие модели снабжались предварительно обработанными образцами изображений и соответствующими метками изображений. Изображения хранились в виде массива Numpy в списке, а метки также хранились в списке. После этого список был преобразован в массивы Numpy, как того требуют модели обучения. Сверточная сеть вместе с другими моделями обучения, такими как K-NN и SVM (машины опорных векторов), использовались для получения результатов.

Исходные репозитории

Заключение

Были извлечены функции, важные для обнаружения диабетической ретинопатии, которые не только помогут врачу сузить проблему до конкретной особенности, такой как кровеносный сосуд или экссудаты, но также помогут любому будущему роботу с искусственным интеллектом в диагностике состояния. Тот факт, что обучающая модель может предсказать диабетическую ретинопатию, также поможет людям, не имеющим доступа к медицинскому диагнозу.

Будущее

Точность моделей может быть повышена за счет использования изображений сетчатки глаза с более высоким разрешением для обучения такой модели - потребуются высокопроизводительный процессор и графический процессор. Благодаря постоянному совершенствованию алгоритмов и методов обработки изображений, вскоре станет возможным более эффективное извлечение изображений. Эксперименты можно проводить с рядом моделей CNN и изменять параметры других моделей обучения, чтобы получить еще лучшие и еще более надежные результаты.

В следующих блогах я расскажу о результатах извлечения и предварительной обработки данных, а также об используемых моделях классификации.