Я знаю, что vw может обрабатывать очень необработанные данные (например, необработанный текст), но, например, следует ли рассмотреть возможность масштабирования числовых функций перед подачей данных в vw? Рассмотрим следующую строку:
1 |n age: 80.0 height: 180.0 |c male london |d the:1 cat:2 went:3 out:4
Предполагая, что типичный возраст находится в диапазоне от 1 до 100, а рост (в сантиметрах) может варьироваться от 140 до 220, лучше ли преобразовать/масштабировать age
и height
, чтобы они имели общий диапазон? Я думаю, что многим алгоритмам может понадобиться такая предварительная обработка входных данных, например, линейная регрессия.