Если вы посмотрите на широкий спектр проблем машинного обучения, вы увидите, что в среднем, когда у вас много данных, вы склонны находить людей, использующих более простые алгоритмы, а также меньшую ручную разработку.

Когда мы смотрим на приложения машинного обучения, алгоритм обучения имеет два источника знаний.

  1. Помеченные данные
  2. Ручная инженерия.

Вы можете тщательно вручную спроектировать функции или вручную спроектировать сетевую архитектуру или, возможно, другие компоненты вашей системы.

Когда у вас не так много размеченных данных, вам просто нужно больше прибегать к ручной инженерии. Для компьютерного зрения, несмотря на то, что наборы данных становятся все больше и больше, часто у нас просто не так много данных, как нам нужно. И именно поэтому компьютерное зрение исторически и даже сегодня больше полагалось на ручную разработку и разработало довольно сложные сетевые архитектуры.

К счастью, когда у вас мало данных, очень помогает перенос обучения.

Исследователи компьютерного зрения уделяют большое внимание успешному выполнению тестов. Но вы также видите в газетах, что люди делают вещи, которые позволяют вам хорошо справляться с эталонными тестами, но которые вы на самом деле не будете использовать в производстве или в системе, которую вы развертываете в реальном приложении.

Несколько советов, как добиться успеха в тестах.

  1. Сборка.

И это означает, что после того, как вы выяснили, какая нейронная сеть вам нужна, обучите несколько нейронных сетей независимо и усредните их результаты.

Итак, инициализируйте, скажем, 3, или 5, или 7 нейронных сетей случайным образом и обучите все эти нейронные сети, а затем усредните их выходные данные. И это заставит вас работать на 1% или 2% лучше. Это замедляет время работы в 3–15 раз, а иногда и больше. Таким образом, сборка — это один из тех советов, которые люди используют, чтобы добиться хороших результатов в тестах и ​​для победы в соревнованиях. Но он почти никогда не используется в продакшене для обслуживания реальных клиентов, если только у вас нет огромного вычислительного бюджета и вы не возражаете потратить гораздо больше на каждый образ клиента.

2. Еще одна вещь, которую вы видите в документах, которая действительно помогает при тестировании, — это мультикадрирование во время тестирования. Итак, если у вас есть вычислительный бюджет, вы можете сделать это.

Давайте взглянем на два важных приложения CNN:

Объект Обнаружение и локализация

Распознавание лиц/Детекция