До сих пор я использовал dask с get
и словарем для определения графа зависимостей моих задач. Но это означает, что я должен определить весь свой график с самого начала, и теперь я хочу добавлять время от времени новые задачи (с зависимостями от старых задач).
Я читал о пакете distributed
, и он кажется подходящим. Я видел два возможных варианта определения моего графика:
Используя
delayed
, определите зависимости между каждой задачей:t1 = delayed(f)() t2 = delayed(g1)(t1) t3 = delayed(g2)(t1) dask.compute([t2, t3])
Используя _5 _ / _ 6_, сделайте что-нибудь вроде:
t1 = client.submit(f) t2 = client.map(g1, [t1])[0] t3 = client.map(g2, [t1])[0]
Как вы думаете, что более уместно? Спасибо!