Мне нужно запустить тысячи* моделей на 15 машинах (каждая по 4 ядра), все под Windows. Я начал изучать пакеты parallel
, snow
и snowfall
и прочитал кучу вводных, но в основном они сосредоточены на настройке мастера. Существует лишь немного информации о том, как настроить рабочие (подчиненные) узлы в Windows. Информация часто противоречива: одни говорят, что кластер SOCK - это практически самый простой путь, другие утверждают, что Настройка кластера SOCK сложна в Windows (настройка sshd), и лучше всего использовать MPI.
Итак, как проще всего установить подчиненные узлы в Windows? MPI, PVM, SOCK или NWS? Моими, возможно, наивными идеями были (перечислены по приоритету):
- Использовать все 4 ядра на ведомых узлах (обязательно).
- В идеале мне нужен только R с некоторыми пакетами и подчиненный R-скрипт или функция R, которая прослушивала бы какой-то порт и ждала задач от мастера.
- В идеале узлы могут динамически добавляться/удаляться из кластера.
- В идеале ведомые устройства должны подключаться к ведущему, поэтому мне не нужно было бы перечислять все IP-адреса ведомых устройств в конфигурации ведущего устройства.
Только 1 требуется на 100%, 2-4 "было бы хорошо". Слишком наивно просить?
Извините, но я не смог понять это из доступных документов и руководств. Буду благодарен, если укажете на правильный источник.
* Обратите внимание, что создание каждой из этих тысяч моделей займет не менее 7 минут, так что больших затрат на связь не возникнет.
sfExport
иsfLibrary
). - person Roman Luštrik   schedule 24.03.2014SOCK
. - person Roman Luštrik   schedule 24.03.2014