У меня есть список из более чем 25 миллионов записей (1D Array). Я хочу нормализовать значения от 0 до 5.
Для этого я использую MinMaxScaler от scikit-learn. Эта штука отлично работает с записями размером до 20 Мбайт, но по мере увеличения размера на это уходит много времени.
Любые предложения, как сделать это оптимальным образом.
partial_fit
scikit- learn.org/stable/modules/generated/ - person ManojK   schedule 19.02.2020