В большинстве задач машинного обучения довольно сложно получить линейную границу для классификаций, используя текущее количество признаков. Это легко понять, построив визуализацию.

Эту проблему можно решить, используя хитрость ядра. Трюк с ядром — это метод проецирования данных (в настоящее время находящихся в низком измерении/пространстве признаков) в более высокое измерение. Проще говоря, мы просто увеличиваем количество функций или столбцов.

Делая это, мы можем сформировать почти линейную границу в пространстве более высокого измерения, чтобы точно их классифицировать. Добавляемые дополнительные функции должны быть нелинейными (не линейно коррелированными).

Примечание.Трюк с ядром – это всего лишь метод проецирования данных в более высокое измерение. Это не метод классификации.

После применения трюка с ядром мы можем использовать логистическую регрессию или SVM (машины опорных векторов).

В логистической регрессии ошибка рассчитывается для каждой точки данных, а затем минимизируется. В SVM только точки данных рядом с границей классификации в пределах определенного предела. Эти точки называются векторами поддержки. Основная цель — классифицировать точки данных, максимизируя запас с помощью опорных векторов.

Одним из основных преимуществ SVM является то, что он снижает вычислительную нагрузку, поскольку учитываются только опорные векторы, а не все точки данных, как это видно в логистической регрессии.