SVM (машины опорных векторов): математика стала проще

автор: Теджвир Сингх, Танви Малхотра — 11 ноября 2018 г.

В наших группах сверстников многие ученики боятся математики, лежащей в основе машин опорных векторов (SVM). Итак, это наша попытка сделать учебник для лучшего понимания SVM. В последующих блогах мы углубимся в математику и интуицию, стоящую за SVM.

Цель SVM

SVM — это контролируемый алгоритм машинного обучения. Нам нужна зависимая переменная, то есть переменная для прогнозирования вместе с независимыми переменными или предикторами.

Это алгоритм классификации, используемый для прогнозирования двоичных классов, который может быть расширен до мультикласса.

Алгоритм SVM находит оптимальную «гиперплоскость» в обучающих данных. Термин «оптимальный» станет понятен при дальнейшем чтении.

Мы нанесли на график плотность и жировые отложения нескольких людей, а также есть способ различить людей моложе 25 лет и людей старше 25 лет. Мы найдем гиперплоскость, которая будет линией в случае 2d плоскость для различения возрастов младше 25 и старше 25 лет.

Но вопрос в том, как найти эту гиперплоскость, и таких гиперплоскостей может быть несколько, которые могут разделить данные на две категории.

Нам нужно найти оптимальную гиперплоскость.

Что такое гиперплоскость?

а. В одномерном пространстве это будет точка.

б. В двухмерном пространстве это будет линия.

в. В трехмерном пространстве это будет плоскость.

д. В более высоком измерении это будет гиперплоскость.

На рисунке ниже мы видим, что гиперплоскостей может быть много, но нам нужно найти оптимальную гиперплоскость.

Цель SVM состоит в том, чтобы найти нижнюю гиперплоскость, которая является оптимальной, поскольку она находится далеко от обеих категорий.

Определение поля: Расстояние между ближайшей точкой категории и гиперплоскостью называется полем.

SVM найдет оптимальную гиперплоскость с максимальным запасом. Скорее всего, у нас не будет никаких данных на полях.

Могут быть и другие гиперплоскости с другим запасом, но мы выберем вышеуказанную гиперплоскость с максимальным запасом.

______________________________________________________________________________

Цель SVM: найти оптимальную гиперплоскость с максимальным запасом.