Если вы посмотрите на широкий спектр проблем машинного обучения, вы увидите, что в среднем, когда у вас много данных, вы склонны находить людей, использующих более простые алгоритмы, а также меньшую ручную разработку.
Когда мы смотрим на приложения машинного обучения, алгоритм обучения имеет два источника знаний.
- Помеченные данные
- Ручная инженерия.
Вы можете тщательно вручную спроектировать функции или вручную спроектировать сетевую архитектуру или, возможно, другие компоненты вашей системы.
Когда у вас не так много размеченных данных, вам просто нужно больше прибегать к ручной инженерии. Для компьютерного зрения, несмотря на то, что наборы данных становятся все больше и больше, часто у нас просто не так много данных, как нам нужно. И именно поэтому компьютерное зрение исторически и даже сегодня больше полагалось на ручную разработку и разработало довольно сложные сетевые архитектуры.
К счастью, когда у вас мало данных, очень помогает перенос обучения.
Исследователи компьютерного зрения уделяют большое внимание успешному выполнению тестов. Но вы также видите в газетах, что люди делают вещи, которые позволяют вам хорошо справляться с эталонными тестами, но которые вы на самом деле не будете использовать в производстве или в системе, которую вы развертываете в реальном приложении.
Несколько советов, как добиться успеха в тестах.
- Сборка.
И это означает, что после того, как вы выяснили, какая нейронная сеть вам нужна, обучите несколько нейронных сетей независимо и усредните их результаты.
Итак, инициализируйте, скажем, 3, или 5, или 7 нейронных сетей случайным образом и обучите все эти нейронные сети, а затем усредните их выходные данные. И это заставит вас работать на 1% или 2% лучше. Это замедляет время работы в 3–15 раз, а иногда и больше. Таким образом, сборка — это один из тех советов, которые люди используют, чтобы добиться хороших результатов в тестах и для победы в соревнованиях. Но он почти никогда не используется в продакшене для обслуживания реальных клиентов, если только у вас нет огромного вычислительного бюджета и вы не возражаете потратить гораздо больше на каждый образ клиента.
2. Еще одна вещь, которую вы видите в документах, которая действительно помогает при тестировании, — это мультикадрирование во время тестирования. Итак, если у вас есть вычислительный бюджет, вы можете сделать это.
Давайте взглянем на два важных приложения CNN:
Объект Обнаружение и локализация
Распознавание лиц/Детекция