Машины опорных векторов (SVM)

Краткий обзор

Введение

Машины опорных векторов (SVM) - это набор контролируемых методов обучения, которые обучаются на основе набора данных и могут использоваться как для регрессии, так и для классификации. SVM - это своего рода классификатор с большой маржой: это метод машинного обучения на основе векторного пространства, цель которого - найти границу принятия решения между двумя классами, которая находится максимально далеко. из любой точки обучающих данных.

Векторы поддержки:

Термин «опорные векторы» относится к координатам индивидуального наблюдения. Машина опорных векторов - это граница, которая лучше всего разделяет два класса с помощью гиперплоскости / линии.

Работа SVM:

Модель SVM - это представление примеров в виде точек в пространстве, сопоставленных таким образом, что примеры отдельных категорий разделены четким промежутком, который является как можно более широким. Затем новые примеры отображаются в том же пространстве и предсказываются как принадлежащие к категории, в зависимости от того, на какую сторону пропасти они попадают.

Помимо выполнения линейной классификации, SVM могут эффективно выполнять нелинейную классификацию, используя так называемый трюк с ядром, неявно отображая свои входные данные в пространственные объекты большой размерности.

Метод ядра:

Метод ядра используется SVM для выполнения нелинейной классификации. Они берут низкоразмерное входное пространство и преобразуют его в высокомерное входное пространство. Он конвертирует неразрывные классы в разделяемые, находит способ разделения данных на основе определенных нами меток данных.

Возможности и преимущества SVM:

Они максимизируют запас границы решения, используя методы квадратичной оптимизации, которые находят оптимальную гиперплоскость.
Он может обрабатывать большие пространства функций.
SVM очень хороши, когда мы не имеем представления о наших данных.
Хорошо работает даже с неструктурированными и полуструктурированными данными, такими как текст, изображения и деревья.
Уловка с ядром - настоящая сила SVM. С соответствующей функцией ядра мы можем решить любую сложную проблему.
Он относительно хорошо масштабируется для данных большого размера.
На практике модели SVM имеют обобщение, риск переобучения в SVM меньше.

Ограничения SVM:

Он чувствителен к шуму.
Распространение классификации на более чем два класса проблематично.
Выбрать «хорошую» функцию ядра непросто.
Длительное обучение для больших наборов данных.
Трудно понять и интерпретировать окончательную модель, переменные веса и индивидуальное влияние.
Поскольку окончательную модель не так просто увидеть, мы не можем выполнять небольшие калибровки модели, поэтому сложно включить нашу бизнес-логику.
Гиперпараметры SVM: Стоимость -C и гамма. Настроить эти гиперпараметры не так-то просто. Их влияние сложно представить

Некоторые приложения SVM:

Классификация текста (и гипертекста).
Классификация изображений.
Биоинформатика (классификация белков, классификация рака).
Распознавание рукописных символов.
Определение спама по электронной почте.
Анализ временных рядов.
Обнаружение аномалий.