Краткий обзор

Введение

Машины опорных векторов (SVM) - это набор контролируемых методов обучения, которые обучаются на основе набора данных и могут использоваться как для регрессии, так и для классификации. SVM - это своего рода классификатор с большой маржой: это метод машинного обучения на основе векторного пространства, цель которого - найти границу принятия решения между двумя классами, которая находится максимально далеко. из любой точки обучающих данных.

Векторы поддержки:

Термин «опорные векторы» относится к координатам индивидуального наблюдения. Машина опорных векторов - это граница, которая лучше всего разделяет два класса с помощью гиперплоскости / линии.

Работа SVM:

Модель SVM - это представление примеров в виде точек в пространстве, сопоставленных таким образом, что примеры отдельных категорий разделены четким промежутком, который является как можно более широким. Затем новые примеры отображаются в том же пространстве и предсказываются как принадлежащие к категории, в зависимости от того, на какую сторону пропасти они попадают.

Помимо выполнения линейной классификации, SVM могут эффективно выполнять нелинейную классификацию, используя так называемый трюк с ядром, неявно отображая свои входные данные в пространственные объекты большой размерности.

Метод ядра:

Метод ядра используется SVM для выполнения нелинейной классификации. Они берут низкоразмерное входное пространство и преобразуют его в высокомерное входное пространство. Он конвертирует неразрывные классы в разделяемые, находит способ разделения данных на основе определенных нами меток данных.

Возможности и преимущества SVM:

  1. Они максимизируют запас границы решения, используя методы квадратичной оптимизации, которые находят оптимальную гиперплоскость.
  2. Он может обрабатывать большие пространства функций.
  3. SVM очень хороши, когда мы не имеем представления о наших данных.
  4. Хорошо работает даже с неструктурированными и полуструктурированными данными, такими как текст, изображения и деревья.
  5. Уловка с ядром - настоящая сила SVM. С соответствующей функцией ядра мы можем решить любую сложную проблему.
  6. Он относительно хорошо масштабируется для данных большого размера.
  7. На практике модели SVM имеют обобщение, риск переобучения в SVM меньше.

Ограничения SVM:

  1. Он чувствителен к шуму.
  2. Распространение классификации на более чем два класса проблематично.
  3. Выбрать «хорошую» функцию ядра непросто.
  4. Длительное обучение для больших наборов данных.
  5. Трудно понять и интерпретировать окончательную модель, переменные веса и индивидуальное влияние.
  6. Поскольку окончательную модель не так просто увидеть, мы не можем выполнять небольшие калибровки модели, поэтому сложно включить нашу бизнес-логику.
  7. Гиперпараметры SVM: Стоимость -C и гамма. Настроить эти гиперпараметры не так-то просто. Их влияние сложно представить

Некоторые приложения SVM:

  1. Классификация текста (и гипертекста).
  2. Классификация изображений.
  3. Биоинформатика (классификация белков, классификация рака).
  4. Распознавание рукописных символов.
  5. Определение спама по электронной почте.
  6. Анализ временных рядов.
  7. Обнаружение аномалий.