Тема: Классификация растений, которые являются здоровыми или больными, и позволяют прогнозировать заболевание растений на фотографиях.
Члены команды: Севда Саян, Фатманур Турхан, Исмет Сейхан
В нашем блоге на прошлой неделе мы объяснили наш подход и библиотеки, которые мы будем использовать. В этом блоге мы объясним эксперименты, над которыми мы работаем, и укажем некоторые первоначальные результаты.
Мы решили использовать полезность глубоких сверточных нейронных сетей для нашей классификации. До сих пор мы сосредоточились на архитектуре VGG16, предложенной К. Симоняном и А. Зиссерманом из Оксфордского университета. Они представили ее на ILSVRC-2014 и стали одной из самых известных моделей. Это довольно большая сеть с примерно 138 миллионами параметров.
Ниже указаны экспериментальные конфигурации, на которых мы сосредоточимся, изменив следующие параметры.
Конфигурации о архитектуре
- VGG16
- Resnet50
Конфигурации о механизме обучения
- Трансферное обучение
- Обучение с нуля
Для начала мы обучили нашу модель VGG16 с нуля, используя наш заниженный набор данных. Но полученные потери и погрешности не приносили удовлетворения. Как видно на графиках ниже, точность поезда начинается с 4% и заканчивается 16%, когда точность проверки начинается с 10% и заканчивается 33%.
Затем мы обучили VGG16, используя трансферное обучение в нашем наборе данных. В результате мы получили более высокие баллы как на этапе обучения, так и на этапе проверки. Точность обучения начинается с 54% и заканчивается 85%, когда точность проверки начинается с 81% и заканчивается 94%.
В этих экспериментах мы использовали оптимизатор Adam, и скорость обучения установлена на 0,001. Каждый эксперимент длится в общей сложности 20 эпох, где эпоха относится к одному циклу через весь набор обучающих данных. В каждую эпоху мы обычно наблюдали уменьшение потерь и увеличение точности, как и должно быть.
Среди механизмов трансферного обучения и обучения с нуля трансферное обучение стабильно работает лучше, чем обучение с нуля, и всегда дает лучшие результаты, которых ожидалось.
После этого мы завершим наши эксперименты и выберем лучшую модель. Мы оцениваем, что модель, составленная из Resnet50 с использованием метода трансферного обучения, подойдет для нашей проблемы. После этого мы будем наблюдать точности на основе классов и попытаемся улучшить недостаточные.
На следующей неделе мы укажем наши следующие эксперименты, которые касаются Resnet50.
Спасибо, что прочитали…