Какая реализация SPARQL (triplestore) идеальна для производительности чтения?

Я новичок в RDf и ищу базу данных RDF с открытым исходным кодом, которая имеет отличную производительность чтения. Будет около 10 миллиардов троек и более 100 запросов SPARQL в секунду. Прямо сейчас мне не нужно одновременно читать и писать в базу данных.

Я видел базы данных, зарегистрированные в Википедии (http://en.wikipedia.org/wiki/SPARQL#SPARQL_implementations), но мне нужен совет эксперта о том, какая система наиболее проверена временем. Он должен иметь лицензию Apache или такую же разрешительную лицензию.

sparql rdf triplestore

EternallyCurious 16.03.2013 источник

Ответы (1)

arrow_upward
4
arrow_downward

Jena и Sesame, вероятно, единственные базы данных, соответствующие вашим критериям лицензирования, но ни одна из них не масштабируется до нужного вам размера. Йена с TDB может, но я не уверен, какова будет производительность при таком масштабе. Sesame Native определенно не рассчитан на такой масштаб.

Существуют и другие базы данных с открытым исходным кодом, но они находятся под лицензией GPL, например 4store, что может соответствовать вашим критериям производительности. Но лучше всего использовать коммерческую базу данных (большинство из них имеют бесплатные ознакомительные версии); это лучший способ получить масштаб и пропускную способность чтения, которые вы хотите. Но это означает, что вам, возможно, придется платить кому-то за их тяжелую работу, облом, я знаю.

Michael 16.03.2013

comment

Возможно, вам придется заплатить кому-то за их тяжелую работу +1 - RobV; 19.03.2013

Какая реализация SPARQL (triplestore) идеальна для производительности чтения?

Ответы (1)

Вопросы по теме