Есть несколько вариантов доступа к библиотекам R в Spark:
- непосредственно с помощью sparkr
- используя языковые привязки, такие как rpy2 или
rscala
- с помощью отдельной службы, такой как opencpu
Похоже, что SparkR довольно ограничен, OpenCPU требует наличия дополнительных услуг, а привязки могут иметь проблемы со стабильностью. Есть ли что-то еще, специфичное для архитектуры Spark, что затрудняет использование любого решения.
У вас есть опыт интеграции R и Spark, которым вы можете поделиться?