Я просматривал учебные пособия Microsft по Python CNTK для версии 2 Beta 9.0. Я не нашел хорошей документации с примерами рекомендуемых значений для передачи различным учащимся. Мне удалось заставить следующих учащихся работать над учебным курсом CNTK 103: Часть B - Прямая сеть с MNIST:
lr_per_minibatch=learning_rate_schedule(0.2, UnitType.minibatch)
trainer = Trainer(z, ce, pe, sgd(z.parameters, lr=lr_per_minibatch))
lr_per_minibatch=learning_rate_schedule(0.2, UnitType.minibatch)
trainer = Trainer(z, ce, pe, adagrad(z.parameters, lr=lr_per_minibatch))
lr_per_minibatch=learning_rate_schedule(0.05, UnitType.minibatch)
trainer = Trainer(z, ce, pe, adam_sgd(z.parameters, lr=lr_per_minibatch, momentum=momentum_as_time_constant_schedule(700) ))
lr_per_minibatch=learning_rate_schedule(0.2, UnitType.minibatch)
trainer = Trainer(z, ce, pe, nesterov(z.parameters, lr=lr_per_minibatch, momentum=momentum_as_time_constant_schedule(700) ))
lr_per_minibatch=learning_rate_schedule(0.1, UnitType.minibatch)
trainer = Trainer(z, ce, pe, rmsprop(z.parameters, lr=lr_per_minibatch, gamma=0.90, inc=0.03, dec=0.03, max=0.1, min=0.1 ))
Они работают, но есть ли у кого-нибудь хорошие примеры рекомендуемых значений параметров, которые получает каждый тренер?