В настоящее время я реализую нейронную сеть, которая использует отсев. Встал вопрос, когда прекращать тренировки.
Обычно я бы использовал раннюю остановку, чтобы определить эту точку, но в исходном выпадающем документе указано, что «Отсев позволяет обучать гораздо большие сети и устраняет необходимость ранней остановки».
Если они не применяют раннюю остановку, какую процедуру остановки они используют?