Вопросы по теме 'dask-delayed'

Доступ к одному элементу в большом опубликованном массиве с помощью Dask
Есть ли более быстрый способ получить только один элемент в большом опубликованном массиве с помощью Dask без получения всего массива? В приведенном ниже примере client.get_dataset ('array1') [0] занимает примерно то же время, что и...
450 просмотров
schedule 01.11.2021

Dask - Как отменить и повторно отправить зависшие задачи?
Часто я сталкиваюсь с проблемой, когда Dask случайным образом останавливается на нескольких задачах, обычно связанных с чтением данных с другого узла в моей сети (подробнее об этом ниже). Это может произойти после нескольких часов работы скрипта без...
542 просмотров

Задайте вопрос, как определить настраиваемую (временную) функцию, которая работает параллельно и возвращает фрейм данных с другой формой
Я пытаюсь реализовать функцию временного сворачивания для «сопоставления» с различными разделами фрейма данных dask, который, в свою очередь, изменяет форму рассматриваемого фрейма данных (или, альтернативно, создает новый фрейм данных с измененной...
389 просмотров

Создание графа вычислений в dask
До сих пор я использовал dask с get и словарем для определения графа зависимостей моих задач. Но это означает, что я должен определить весь свой график с самого начала, и теперь я хочу добавлять время от времени новые задачи (с зависимостями от...
364 просмотров

FileNotFoundError при выполнении Dask dekayed и вычисления
Я новичок в параллельной обработке и прошу приложение. Итак, у меня есть тысячи файлов, которые я хочу запускать параллельно, поэтому я использую для этого вычисления Dask. Мои рабочие и ядра распределены правильно. И я запускаю все в JuputerLab...
60 просмотров

Почему иногда мне нужно дважды вызывать compute () для отложенных функций dask?
Я работаю с отложенными функциями dask и знакомлюсь с тем, что можно и чего нельзя делать при использовании декоратора @dask.delayed для функций. Я понял, что иногда мне нужно дважды позвонить compute() , чтобы получить результат, несмотря на то,...
315 просмотров
schedule 31.03.2022

Создание фрейма данных dask из отложенных массивов dask
У меня есть список отложенных массивов dask, хранящихся в dask_arr_ls , которые я хочу превратить в фрейм данных dask. Вот скелет моего конвейера: def simulate_device_data(num_id): # create data for unknown number of timestamps data_ls =...
92 просмотров
schedule 20.04.2022

Dask отложен / массив dask нет ответа
У меня есть распределенная установка кластера dask, и я использовал ее для загрузки и преобразования кучи данных. Работает как шарм. Я хочу использовать его для параллельной обработки. Вот моя функция el = 5000 n_using = 26 n_across= 6 mat =...
297 просмотров

Dask использует большое количество памяти при вычислении двух значений с общей зависимостью
Я использую Dask на одной машине ( LocalCluster с 4 процессами, 16 потоками, 68,56 ГБ памяти), и у меня возникают проблемы с рабочей памятью при попытке вычислить сразу два результата, которые имеют общую зависимость. В примере, показанном ниже,...
150 просмотров

Создание пакета dask из генератора
Я хотел бы создать dask.Bag (или dask.Array ) из списка генераторов. Проблема в том, что генераторы (при оценке) слишком велики для памяти. delayed_array = [delayed(generator) for generator in list_of_generators] my_bag =...
1015 просмотров
schedule 25.07.2022

Даск задержан + Matplotlib.savefig () -> FAIL
Моя цель - создать несколько файлов png из нескольких массивов numpy, загруженных из медицинских изображений на моем HD. Чтобы ускорить процесс, я использую dask delayed. Вот мой рабочий код: import os.path from glob import glob import nibabel...
434 просмотров

Не могу обучить модель Keras с помощью Dask?
Я ожидал от простых примеров с использованием задержки Dask. Я читал, что могу по существу воспроизвести gridsearchcv из scikit-learn с помощью нескольких вызовов функций следующим образом. Похоже, что модель никогда не подходит (model.fit(...))...
1014 просмотров
schedule 12.12.2022

Разделение очень больших файлов csv на файлы меньшего размера
Подходит ли Dask для параллельного чтения больших CSV-файлов и разделения их на несколько файлов меньшего размера?
351 просмотров
schedule 26.10.2022

Где dask хранит файлы во время работы на juputerlab
Я запускаю dask на jupyterlab. Я пытаюсь сохранить какой-то файл в домашнем каталоге, где хранится мой файл Python, и он работает правильно, но я не могу узнать, где сохраняются мои файлы. Поэтому я создал папку с именем output в домашнем каталоге,...
50 просмотров

Как я могу выполнить определенную функцию на каждом листе файла xlsx, имеющего более 100 листов параллельно?
У меня есть xlsx файл File.xlsx , в нем больше 100 листов. Мне нужно выполнить определенную функцию f() для данных каждого листа и, наконец, вернуть список операций каждого листа, объединенных вместе. Я попытался использовать pandas, читая...
67 просмотров