Введение

В современном мире чрезвычайно сложная задача машинного обучения с учителем требует сотен ГБ оперативной памяти, которая доступна вам за небольшие инвестиции или аренду. Однако получение доступа к графическим процессорам не является бесплатным. У вас должен быть доступ к графическим процессорам со 100 ГБ видеопамяти, что будет непросто и будет стоить больших денег.

Мы должны более разумно использовать наши ресурсы при решении проблем глубокого обучения. Особенно когда мы пытаемся решить сложные проблемы реального мира в таких областях, как распознавание речи и изображений. Если в вашей модели есть несколько скрытых слоев, добавление новых потребует огромного количества ресурсов.

Вы также можете прочитать: Лучшие курсы по аналитике данных в Индии в 2022 году | Курсы по аналитике данных в Индии: подробности, стоимость, право на участие, учебный план 2022

Благодаря «Переносному обучению», которое позволяет нам использовать предварительно обученные модели, созданные другими, путем внесения незначительных изменений. В этой статье я объясню, как использовать предварительно обученные модели для ускорения ваших решений.

Что такое трансферное обучение?

На наборе данных обучается нейронная сеть. Эти данные компилируются как «веса» сети, и сеть учится на них. Эти веса можно извлечь, а затем применить к любой другой нейронной сети. Мы «переносим» изученные характеристики, а не запускаем другую нейронную сеть с нуля.

Как использовать предварительно обученные модели?

· Единственным ограничением на использование предварительно обученной модели является ваше воображение.

Помните, что сверточные слои рядом с входным слоем модели изучают функции низкого уровня, такие как линии, слои в середине слоя изучают составные абстрактные функции, которые объединяют функции более низкого уровня, извлеченные из входных данных, а слои рядом с выходным слоем интерпретируют объекты. выявить признаки в контексте задачи классификации.

Вы также можете прочитать: Лучшие курсы по науке о данных, большим данным и аналитике в Мумбаи | Колледжи, предлагающие курсы по аналитике данных в Мумбаи

· Обладая этими знаниями, можно выбрать уровень детализации для извлечения признаков из предварительно обученной модели. Например, вывод предварительно обученной модели после нескольких слоев может быть адекватным, если новая задача сильно отличается от категоризации элементов в изображениях (например, отличается от ImageNet). Вывод из значительно более глубоких слоев модели или даже вывод полностью связанного слоя перед выходным слоем может быть использован, если новая задача относительно сопоставима с задачей категоризации объектов на изображениях.

· Другим вариантом является прямое включение предварительно обученной модели или желаемого компонента модели в новую модель нейронной сети. Веса предварительно обученной модели можно установить в этом приложении как «замороженные», чтобы они не изменялись при обучении новой модели. В качестве альтернативы веса могут быть изменены во время обучения новой модели, возможно, с более медленной скоростью обучения, что позволяет ранее обученной модели функционировать как метод инициализации веса.

Ниже приводится краткое описание некоторых из этих шаблонов использования:

Классификатор:

Для категоризации новых фотографий напрямую используется предварительно обученная модель.

Автономное средство извлечения функций:

· Предварительно обученная модель используется для предварительной обработки изображений и извлечения соответствующих признаков или подмножества модели.

· Предварительно обученная модель или подмножество модели объединяются в новую модель с помощью встроенного экстрактора признаков: однако слои предварительно обученной модели замораживаются во время обучения.

Вы также можете прочитать: Обучение курсу Data Science в Бангалоре | Курс по науке о данных в Бангалоре с [сертификатом IBM]

Инициализация веса:

· Слои предварительно обученной модели обучаются вместе с новой моделью. Предварительно обученная модель или часть модели интегрируется в новую модель.

· Каждый метод потенциально может быть эффективным и сэкономить много времени при создании и уточнении модели глубокой сверточной нейронной сети.

· Тестирование может быть необходимо, потому что может быть неочевидно, какое применение предварительно обученной модели даст наилучшие результаты для вашей новой задачи компьютерного зрения.