Вы когда-нибудь задумывались, как ваш мозг может распознавать вещи? Допустим, вы смотрите на картинку с кошкой, и ваш мозг тут же говорит вам, что это кошка. И самое интересное, что вы даже не понимаете, как работает ваш мозг.

Если вы не телепортировались из каменного века, думаю, вы могли слышать о машинном обучении.

Итак, в этой статье я собираюсь объяснить особый тип машинного обучения, известный как нейронные сети.

Итак, прежде всего: что такое нейронная сеть?

Нейронная сеть — это модель компьютерного машинного обучения, вдохновленная человеческим мозгом. Нейронные сети приобрели популярность недавно после того, как Deep Learning от Google стал лучшим игроком Alpha Go.

Самое приятное то, что человек не участвовал, и машина научилась играть в Alpha Go самостоятельно.

В нейронной сети основной единицей является нейрон, а в ИНС (искусственная нейронная сеть) — его персептрон. Персептрон может принимать столько входных данных и подавать свои выходные данные в качестве входных данных нескольким нейронам. Таким образом создается сеть нейронов.

Персептроны были разработаны в 1950-х и 1960-х годах ученым Фрэнком Розенблаттом, вдохновленным более ранней работой Уоррена МакКаллока и Уолтера Питтса.

Один персептрон показан ниже:

Существует множество конфигураций этих нейронов или персептронов; то, как они связаны для формирования различных моделей нейронной сети, таких как глубокие нейронные сети, рекуррентные нейронные сети и т. д.…

Нейронные сети состоят из следующих компонентов

  1. Входной слой, x
  2. Произвольное количество скрытых слоев
  3. Выходной слой, ŷ
  4. Набор весов и смещений между каждым слоем, W и b
  5. Выбор функции активации для каждого скрытого слоя, σ. В этом уроке мы будем использовать функцию активации Sigmoid.

Как нейронная сеть вычисляет вещи:

Нейроны вычисляют, добавляя произведения всех входных данных с весами, а затем предоставляя их в качестве выходных данных.

Затем этот вывод передается функции активации, а вывод функции активации является окончательным выводом, обеспечиваемым нейтроном.

Функция активации — это не что иное, как пороговая функция, которая сопоставляет выходные данные с указанным диапазоном.

Таким образом, выход сопоставляется со значением между пороговыми пределами.

Единственное, что нейронная сеть настраивает/изучает, — это веса. Веса корректируются при обучении нейронной сети.

Затем выходные данные передаются функции активации, и после функции активации мы получаем окончательный результат.

В этом примере используемой функцией активации является сигмовидная функция. Тем не менее, вы можете выбрать одну из многих функций активации, таких как ReLU, SoftMax, TanH и т. д.

Каждый из них служит разным целям и имеет свои плюсы и минусы.