Термины AI и ML сегодня используются взаимозаменяемо. Глубокое обучение (ГО) — это новая форма машинного обучения, которая переносит большую часть тяжелой работы по анализу и обучению многомерных данных ближе к машинам. В этой статье давайте разберемся в основных различиях между тремя.

Искусственный интеллект (ИИ) — это общая терминология, описывающая автоматизированную систему принятия решений на основе заранее определенных правил. Базовая система ИИ не должна учиться на собственном опыте. Примером может служить простой оператор if-else с предопределенными условиями. Как я уже описывал в своих предыдущих статьях, использование сенсора (датчика освещенности) для автоматизации включения и выключения устройства (уличного фонаря) — это простая система ИИ.

Машинное обучение (ML) — это общая терминология, описывающая автоматизированную систему принятия решений на основе простых правил, управляемых человеком, но оптимизированных для машин. Он может улучшаться с опытом, но вскоре достигает насыщения. Примеры; Деревья решений, случайный лес, SVM и т. д.

Нейронные сети (NN) и глубокое обучение (DL) — это специальная терминология, описывающая автоматизированную систему принятия решений на основе сложных, независимых от человека правил, усвоенных машиной с помощью нейронных сетей. Примеры; Многослойный персептрон, сверточные нейронные сети и т. д.

Поскольку ИИ — это самая основная форма принятия решений, мы не будем здесь вдаваться в подробности, а обсудим ключевые различия между МО и ГО.

В моих предыдущих статьях общая система ИИ также описывалась как функция преобразования. Будь то ML или DL, в конечном итоге он пытается найти оптимальную функцию преобразования, которая обычно описывается своими независимыми переменными и коэффициентами f(W, X).

Когда дело доходит до алгоритмов ML, человек должен решить, какое семейство функций использовать для преобразования входных данных в выходные. Как только функция определена, компьютеры используются для поиска оптимальных коэффициентов в этом семействе для наилучшего сопоставления входных данных с выходными. Поиск оптимальных коэффициентов из входных данных называется обучением, а поскольку машина делает это по некоторому алгоритму, это называется машинным обучением. Входные данные обычно не принимаются как есть. Эксперт в предметной области извлекает так называемые функции из входных данных, чтобы уменьшить избыточность и преобразовать их в более абстрактную, но компактную форму, прежде чем передать их в процесс оптимизации. Поскольку люди известны своим воображением и творческим подходом, и это отражается в том, как они разрабатывают функции и выбирают функции, точность решения также зависит от человека. Решения ML также иногда могут работать с очень небольшим объемом данных, поскольку это сильно зависит от способности инженера кодировать решение. Именно поэтому ML требует, чтобы решение было точно описываемым. Количество входных данных не играет существенной роли в постоянном повышении точности алгоритма, поскольку оно в основном будет ограничиваться качеством признаков и возможностями функции, рассматриваемой для обучения. Его можно использовать для автоматизации нескольких задач, и иногда он может быть дешевым в вычислительном отношении. Зависимость системы машинного обучения от человека также может привести к предвзятости решения, связанного с человеческим фактором.

Алгоритмы DL, с другой стороны, могут создавать функции и придумывать функции преобразования самостоятельно, просто зная отображение ввода-вывода. Именно по этой причине НС называют аппроксиматором универсальных функций. Вся эта тяжелая работа, которую они делают, имеет свою цену, и это данные. Системы DL изучают решение самостоятельно за счет огромных объемов данных и людей, которым необходимо точно определить проблему. Неправильная постановка проблемы приводит к неправильному решению. Именно поэтому системы глубокого обучения требуют, чтобы проблема была точно описана. Чтобы аппроксимировать функцию преобразования, системы NN или DL используют несколько масштабированных и сдвинутых версий предопределенных функций, каждая из которых является выходом вычислительного узла. Слово «глубокий» происходит от того факта, что эти узлы могут быть каскадированы в несколько слоев. При таком расположении они не только изучают коэффициенты функции, но и изучают функцию. В отличие от систем машинного обучения, которые зависят от человека, системы глубокого обучения почти не зависят от компьютера, учитывая архитектуру и данные. Архитектура здесь — это в основном расположение нейронов (узлов) и их поведение. Хотя системы глубокого обучения могут превзойти производительность человека в некоторых специализированных задачах, без данных нет решения. Он также страдает от обобщения при меньшем количестве данных, но значительно улучшается при увеличении количества данных. Системы глубокого обучения получают решение исключительно на основе данных и, следовательно, могут иметь систематическую ошибку из-за качества используемых данных. При правильном типе данных и точном определении проблемы система глубокого обучения всегда оптимальна с точки зрения функций и функций, которые она предлагает.

Это не означает, что ML устарел. Аннотации данных для систем DL — это трудоемкая и дорогостоящая задача, выполняемая вручную. Доступность данных также будет минимальной в начале проблемы/проекта, и машинное обучение иногда может действовать как резервная система, помогая нам аннотировать данные, а также получать столь необходимые первоначальные результаты, которые также объяснимы. Но по мере того, как время идет, и становится доступным все больше и больше данных, системы глубокого обучения берут верх. Системы машинного обучения также будут использоваться, если решение может быть сформировано из интерпретируемых человеком правил и работает в контролируемой среде.