Этот код работает так, как ожидалось:
library(dplyr)
data <- list(t1 = "hello world.", t2 = "bye world")
library(doMC)
registerDoMC(3)
res <- foreach(t = data) %dopar% {
print(sprintf("processing %s", t))
data.frame(text = t) %>%
dplyr::count(text)
}
print(res)
Однако этот код просто печатает «обработка привет, мир». и «обработка до свидания», а затем просто зависает (без исключений).
library(dplyr)
coreNLP::initCoreNLP()
data <- list(t1 = "hello world.", t2 = "bye world")
library(doMC)
registerDoMC(3)
res <- foreach(t = data) %dopar% {
print(sprintf("processing %s", t))
coreNLP::annotateString(t)$token
}
print(res)
Приведенный выше код будет работать, как и ожидалось, если я изменю %dopar%
на %do%
.
Я не понимаю, чем вызвано такое поведение. Почему вызов функций coreNLP внутри %dopar%
вызывает зависание R, но отлично работает с другими пакетами? Это как-то связано с зависимостью coreNLP от Java?
Вот вывод sessionInfo()
:
R version 3.4.0 (2017-04-21)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 16.04.2 LTS
Matrix products: default
BLAS: /usr/lib/libblas/libblas.so.3.6.0
LAPACK: /usr/lib/lapack/liblapack.so.3.6.0
locale:
[1] LC_CTYPE=en_US.UTF-8 LC_NUMERIC=C
[3] LC_TIME=en_US.UTF-8 LC_COLLATE=en_US.UTF-8
[5] LC_MONETARY=en_US.UTF-8 LC_MESSAGES=en_US.UTF-8
[7] LC_PAPER=en_US.UTF-8 LC_NAME=C
[9] LC_ADDRESS=C LC_TELEPHONE=C
[11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
loaded via a namespace (and not attached):
[1] compiler_3.4.0