Я попытался запустить tensorflow-wavenet в облачном движке Google Cloud с помощью gcloud ml-engine jobs submit training
, но облачное задание завершилось сбоем. когда он пытался прочитать файл конфигурации json:
with open(args.wavenet_params, 'r') as f:
wavenet_params = json.load(f)
arg.wavenet_params
— это просто путь к файлу json, который я загрузил в корзину облачного хранилища Google. Путь к файлу выглядит так: gs://BUCKET_NAME/FILE_PATH.json
.
Я перепроверил правильность пути к файлу и уверен, что эта часть ответственна за сбой, так как все остальное я закомментировал.
Файл журнала сбоев не дает много информации о том, что произошло:
Module raised an exception for failing to call a subprocess Command '['python', '-m', u'gcwavenet.train', u'--data_dir', u'gs://wavenet-test-data/VCTK-Corpus-Small/', u'--logdir_root', u'gs://wavenet-test-data//gcwavenet10/logs']' returned non-zero exit status 1.
Я заменил wavenet_params = json.load(f)
на f.close()
и все равно получаю тот же результат.
Все работает, когда я запускаю его локально с помощью gcloud ml-engine local train
.
Я думаю, что проблема связана с чтением файлов с gcloud ml-engine
в целом или с тем, что я не могу получить доступ к облачной корзине Google из файла python с gs://BUCKET_NAME/FILE_PATH
.