Проблема с запуском кода UPC по сети: соединение отклонено

когда я запускаю код UPC в сети из 2 узлов с включенной опцией -v для получения подробной информации о выполнении, я замечаю, что главный узел (glitch.rutgers.edu) пытается подключиться сам к себе, а не к своему соседние узлы.

/usr/bin/rsh glitch.rutgers.edu -l sharatds -n '/usr/bin/env'
'GASNET_MAX_SEGSIZE='74344KB'' 'GASNET_VERBOSEENV='1'' '/cac/u01/sharatds/UPC_Tests/./upcMatrxMultplction_mpi' glitch.rutgers.edu 41449 \-p4amslave \-p4yourname glitch.rutgers.edu \-p4rmrank 1
    glitch.rutgers.edu: Connection refused
    p0_5078:  p4_error: Child process exited while making connection to remote process on glitch.rutgers.edu: 0
    p0_5078: (45.046875) net_send: could not write to fd=4, errno = 32
    gasnetrun: unlinking gasnetrun_mpi-temp-4813/rsh gasnetrun_mpi-temp-4813/ssh gasnetrun_mpi-temp-4813/mpirun-rsh gasnetrun_mpi-temp-4813/mpirun-tmp

Почему это происходит ? Любые изменения в конфигурации должны установить это правильно?

Спасибо за вашу помощь


person Sharat Chandra    schedule 19.01.2011    source источник


Ответы (1)


эта ошибка, вероятно, связана с rsh ... вы можете подтвердить это, попытавшись запустить команду rsh с главного узла обратно на себя, например «rsh glitch pwd» (я предполагаю, что это запросит у вас пароль).

person amb    schedule 20.01.2011