SVM (машины опорных векторов): математика стала проще
автор: Теджвир Сингх, Танви Малхотра — 11 ноября 2018 г.
В наших группах сверстников многие ученики боятся математики, лежащей в основе машин опорных векторов (SVM). Итак, это наша попытка сделать учебник для лучшего понимания SVM. В последующих блогах мы углубимся в математику и интуицию, стоящую за SVM.
Цель SVM
SVM — это контролируемый алгоритм машинного обучения. Нам нужна зависимая переменная, то есть переменная для прогнозирования вместе с независимыми переменными или предикторами.
Это алгоритм классификации, используемый для прогнозирования двоичных классов, который может быть расширен до мультикласса.
Алгоритм SVM находит оптимальную «гиперплоскость» в обучающих данных. Термин «оптимальный» станет понятен при дальнейшем чтении.
Мы нанесли на график плотность и жировые отложения нескольких людей, а также есть способ различить людей моложе 25 лет и людей старше 25 лет. Мы найдем гиперплоскость, которая будет линией в случае 2d плоскость для различения возрастов младше 25 и старше 25 лет.
Но вопрос в том, как найти эту гиперплоскость, и таких гиперплоскостей может быть несколько, которые могут разделить данные на две категории.
Нам нужно найти оптимальную гиперплоскость.
Что такое гиперплоскость?
а. В одномерном пространстве это будет точка.
б. В двухмерном пространстве это будет линия.
в. В трехмерном пространстве это будет плоскость.
д. В более высоком измерении это будет гиперплоскость.
На рисунке ниже мы видим, что гиперплоскостей может быть много, но нам нужно найти оптимальную гиперплоскость.
Цель SVM состоит в том, чтобы найти нижнюю гиперплоскость, которая является оптимальной, поскольку она находится далеко от обеих категорий.
Определение поля: Расстояние между ближайшей точкой категории и гиперплоскостью называется полем.
SVM найдет оптимальную гиперплоскость с максимальным запасом. Скорее всего, у нас не будет никаких данных на полях.
Могут быть и другие гиперплоскости с другим запасом, но мы выберем вышеуказанную гиперплоскость с максимальным запасом.
______________________________________________________________________________
Цель SVM: найти оптимальную гиперплоскость с максимальным запасом.