Алгоритм K ближайших соседей — это простой алгоритм классификации, который является одним из наиболее часто используемых алгоритмов классификации. Алгоритм KNN можно использовать как для задач классификации, так и для регрессии, и его результат зависит от нашей цели использования алгоритма.

Как работает КНН?

Алгоритм KNN работает по очень простому принципу. Он сохраняет весь набор данных во время обучения, а при прогнозировании сравнивает ввод с существующими данными и проверяет сходство между ними. Наиболее похожий класс возвращается в качестве прогнозируемого вывода для задачи классификации.

Классификатор k-NN запоминает все данные и метки и предсказывает метку наиболее похожего примера обучающих данных.

Измерение сходства для KNN

Алгоритм kNN измеряет сходство между двумя точками, используя метрику расстояния.

Метрики расстояния, обычно используемые для измерения сходства:

Расстояние L1 или Манхэттенское расстояние

На этом расстоянии берется абсолютная разница двух точек