Я попытался изучить мультипроходы VW:
- Я запустил vw для обычного прогона (1 проход) и проходов со 2 по 5 (удаленный кеш между проверенными проходами) для одних и тех же обучающих данных и проверил модели с другим тестовым файлом. Результаты показали, что моя метрика ухудшилась между проходами (переобучение).
- Затем я проверил, как ведут себя результаты при перетасовке данных. Я хотел проверить поведение моей метрики при перетасовке данных в каждом проходе (--проходы 3 будут перетасовываться после первого и второго внутренних проходов), но поскольку у меня был большой файл данных обучения, я случайным образом перетасовывал данные обучения только один раз перед каждым проходом. проход (опять же от 2 до 5 с удалением кеша между проверенными проходами). Когда я изучил модели с тестовым файлом, результаты показали, что моя метрика улучшилась между проходами.
- Я проводил этот эксперимент несколько раз с разными наборами данных и всегда получал улучшения при использовании нескольких проходов + перемешивание.
Я пытаюсь понять результаты, которые я получил. Я не понимаю, почему перемешивание файла один раз перед обучением помогает улучшить показатель. Почему это также не переобучение? Чем это отличается от использования необработанного набора данных (без перемешивания)?