Я использую довольно большой файл змейки, чтобы вызвать мутации для 30 пациентов. Первым этапом рабочего процесса является выравнивание. Проблема, с которой я сталкиваюсь, заключается в том, что планировщик змейки, кажется, сначала выполняет первый шаг (то есть выравнивание) для всех 30 пациентов. Это, в свою очередь, требует огромного (временного) дискового пространства (›› 10 ТБ). Это совершенно неэффективно, потому что после завершения рабочего процесса один пациент занимает менее 1 ГБ (только файлы vcf).
Итак, мой вопрос в том, есть ли способ заставить snakemake завершить обработку одного пациента перед началом выравнивания (первый шаг) для нового пациента, при этом все еще распределяя все параллельно.
Я попробовал вариант --prioritize
, чтобы установить приоритет последнего правила рабочего процесса, но, похоже, это не помогло.
Любая помощь высоко ценится!
Ваше здоровье!