Dask aysncio tornado TimeoutError

Я выполняю задание Dask-YARN в кластере YARN по расписанию. Задание создает список задач отложенного набора и отправляет его в кластер, используя следующий код:

from dask_yarn import YarnCluster

cluster = YarnCluster()
cluster.scale(8)
app_id = cluster.application_client.id
client = Client(cluster)
dask.compute(dask_tasks)
cluster.shutdown()
client.close()

Затем он записывает журналы рабочих приложений с помощью команды:

yarn logs -applicationId {app_id} -log_files dask.worker.log

После печати всех журналов рабочих я вижу следующее сообщение об ошибке:

End of LogType:dask.worker.log
********************************************************************************

2019/11/28 11:16:24 - asyncio - ERROR - Future exception was never retrieved
future: <Future finished exception=TimeoutError('Timeout')>
tornado.util.TimeoutError: Timeout

Это задание выполняется по расписанию, и сообщение об ошибке выше появляется периодически. Задание также успешно завершается во всех случаях, когда отображается это сообщение об ошибке. Так кто-нибудь знает причину этой ошибки?


person Saurabh    schedule 04.12.2019    source источник


Ответы (1)


Подобные зарегистрированные предупреждения могут иногда появляться, если что-то не очищается должным образом. На практике это не имеет большого значения. Если ваша работа завершится успешно, я, вероятно, проигнорирую ее.

Если вы можете предоставить минимально воспроизводимый пример, вы можете рассмотреть возможность отправки проблемы в трекер проблем dask-yarn.

person MRocklin    schedule 07.12.2019