Сверточные нейронные сети также известны как CNN или ConvNets. Это искусственная нейронная сеть (ANN), наиболее часто используемая для распознавания изображений.

ConvNets сможет обнаруживать шаблоны, и это обнаружение шаблонов делает ConvNets очень полезными при анализе изображений. И их также можно использовать для анализа данных и других задач классификации. Кроме того, ConvNets эффективно используются в задачах обработки естественного языка.

Как и обычные нейронные сети, сверточные нейронные сети имеют входной, скрытый и выходной уровни. Скрытые слои в ConvNets имеют слой свертки, слой объединения и полностью связанный слой.

Как показано на рисунке 1, в ConvNets выполняются четыре основных операции.

Свертка

На этом этапе извлекаются образцы изображения и создается пара фильтров. Изображение будет преобразовано в стек отфильтрованных изображений, а модель свертки сохраняет пространственные отношения между пикселями по фактическим характеристикам изображения с использованием небольших квадратов входных обучающих данных.

И эти фильтры / функции будут выполнять свертку над входным изображением. Фильтр будет перемещаться по изображению на 1 пиксель и выполнять матричное умножение между частью входного изображения и фильтром.

На приведенном выше рисунке матрица 3x3 называется функцией или ядром. А матрица, сформированная путем сдвига фильтра на 1 пиксель по изображению и вычисления скалярного произведения, называется Свернутый элемент или Карта характеристик.
Функции будут соответствовать кусочки входного изображения.

Нелинейность (ReLU)

Это еще один шаг к тому, чтобы сохранить математику без взрыва!
И это нелинейная операция. RELU выполняет операции с каждым пикселем и преобразует отрицательные значения в ноль.

Максимальное объединение или подвыборка

Используя максимальный пул, изображение с большими пикселями может быть уменьшено до изображения с маленькими пикселями. И работать с меньшим пикселем будет проще, чем с большим. Обычно для максимального объединения выбирается размер окна два или три. И максимальное значение из каждого окна будет записано.
Максимальное объединение сохранит тот же образец даже после сжатия изображения.

Например, на приведенном выше рисунке 3 изображение размером 4x4 пикселя сжимается до изображения 2x2 пикселя за счет максимального объединения.

Полностью связанный слой

Это последний слой сверточных нейронных сетей. Здесь каждое значение нейрона получает окончательный ответ на голосование. Нейроны в этом слое связаны с нейронами в предыдущем слое.
Выходные данные объединяющего и сверточного слоев содержат высокоуровневые подробные сведения об обучающем изображении. Но этот слой использует эти функции для классификации входного изображения по различным классам на основе обучающего набора.