Искусственные нейронные сети невероятно хорошо справляются с машинным обучением. Искусственные нейронные сети используются, среди прочего, для классификации слов, аудио и изображений. Различные типы нейронных сетей используются для различных приложений.

Подобно тому, как мы используем рекуррентные нейронные сети для прогнозирования порядка слов, сверточные нейронные сети обычно используются для классификации изображений.

Нейронные сети, которые лучше всего подходят для решения тех же задач, что и зрительная система человека, называются сверточные нейронные сети (иногда мы говорим convnet или CNN<). /strong> вместо этого.)

Сверточный классификатор

Connet, используемый для классификации изображений, состоит из двух частей:

  • Сверточная база
  • Плотная голова.

Чтобы извлечь функции из изображения, мы используем базу. Хотя часто присутствуют и другие типы слоев, слои, которые выполняют процесс свертки, составляют большую часть структуры.

Голова используется для идентификации класса изображения. Обычно он состоит из плотных слоев, но может также содержать такие слои, как отсев.

Два наиболее важных типа слоев, которые обычно встречаются в базе, — это слой свертки с активацией ReLU и слой максимального объединения.

Извлечение признаков

Извлечение признаков, выполняемое базой, состоит из трех основных операций:

  1. Фильтрация изображения по определенному признаку (свертка)
  2. Обнаружение этой функции в отфильтрованном изображении (ReLU)
  3. Сжать изображение, чтобы улучшить характеристики (максимальное объединение)

Использованная литература: