Я пытаюсь лучше понять, как значения моего вектора признаков могут повлиять на результат. Например, предположим, что у меня есть следующий вектор с конечным значением, являющимся результатом (например, это проблема классификации с использованием SVC):
0.713, -0.076, -0.921, 0.498, 2.526, 0.573, -1.117, 1.682, -1.918, 0.251, 0.376, 0.025291666666667, -200, 9, 1
Вы заметите, что большинство значений сосредоточено вокруг 0, однако есть одно значение, которое на несколько порядков меньше, -200.
Я обеспокоен тем, что это значение искажает прогноз и имеет несправедливо больший вес, чем остальные, просто потому, что значение сильно отличается.
Следует ли об этом беспокоиться при создании вектора признаков? Или статистический тест, который я использую для оценки моего векторного контроля для этого большого (или малого) значения, будет основан на обучающем наборе, который я ему предоставлю? Существуют ли в научном наборе специальные методы, которые вы бы порекомендовали для нормализации вектора?
Спасибо за помощь!