Краткий обзор
Введение
Машины опорных векторов (SVM) - это набор контролируемых методов обучения, которые обучаются на основе набора данных и могут использоваться как для регрессии, так и для классификации. SVM - это своего рода классификатор с большой маржой: это метод машинного обучения на основе векторного пространства, цель которого - найти границу принятия решения между двумя классами, которая находится максимально далеко. из любой точки обучающих данных.
Векторы поддержки:
Термин «опорные векторы» относится к координатам индивидуального наблюдения. Машина опорных векторов - это граница, которая лучше всего разделяет два класса с помощью гиперплоскости / линии.
Работа SVM:
Модель SVM - это представление примеров в виде точек в пространстве, сопоставленных таким образом, что примеры отдельных категорий разделены четким промежутком, который является как можно более широким. Затем новые примеры отображаются в том же пространстве и предсказываются как принадлежащие к категории, в зависимости от того, на какую сторону пропасти они попадают.
Помимо выполнения линейной классификации, SVM могут эффективно выполнять нелинейную классификацию, используя так называемый трюк с ядром, неявно отображая свои входные данные в пространственные объекты большой размерности.
Метод ядра:
Метод ядра используется SVM для выполнения нелинейной классификации. Они берут низкоразмерное входное пространство и преобразуют его в высокомерное входное пространство. Он конвертирует неразрывные классы в разделяемые, находит способ разделения данных на основе определенных нами меток данных.
Возможности и преимущества SVM:
- Они максимизируют запас границы решения, используя методы квадратичной оптимизации, которые находят оптимальную гиперплоскость.
- Он может обрабатывать большие пространства функций.
- SVM очень хороши, когда мы не имеем представления о наших данных.
- Хорошо работает даже с неструктурированными и полуструктурированными данными, такими как текст, изображения и деревья.
- Уловка с ядром - настоящая сила SVM. С соответствующей функцией ядра мы можем решить любую сложную проблему.
- Он относительно хорошо масштабируется для данных большого размера.
- На практике модели SVM имеют обобщение, риск переобучения в SVM меньше.
Ограничения SVM:
- Он чувствителен к шуму.
- Распространение классификации на более чем два класса проблематично.
- Выбрать «хорошую» функцию ядра непросто.
- Длительное обучение для больших наборов данных.
- Трудно понять и интерпретировать окончательную модель, переменные веса и индивидуальное влияние.
- Поскольку окончательную модель не так просто увидеть, мы не можем выполнять небольшие калибровки модели, поэтому сложно включить нашу бизнес-логику.
- Гиперпараметры SVM: Стоимость -C и гамма. Настроить эти гиперпараметры не так-то просто. Их влияние сложно представить
Некоторые приложения SVM:
- Классификация текста (и гипертекста).
- Классификация изображений.
- Биоинформатика (классификация белков, классификация рака).
- Распознавание рукописных символов.
- Определение спама по электронной почте.
- Анализ временных рядов.
- Обнаружение аномалий.