Я загрузил очень большой график в TItan 1.0.0 с бэкендом Cassandra 2.1.13. Мне нужно выполнить некоторые операции с графиками с помощью Spark.
Например,
- Я хочу найти подграфы в очень большом графе с помощью Apache Spark
- Я хочу запустить кластеризацию (код машинного обучения) на графике, хранящемся в Titan, и т. Д.
По сути, я буду применять некоторый алгоритм на TitanGraph с использованием Spark (который, я полагаю, будет быстрее на большом графике).
Я могу найти любые документы, относящиеся к этому, как обрабатывать график. Является ли Spark правильным подходом к применению алгоритмов (машинного обучения) на большом графе? Какими должны быть мои следующие шаги? Как запустить код Spark на Titan? (Я не могу найти точные методы или функции, с помощью которых я должен вставлять / использовать код Spark?
Любая помощь приветствуется.