Какая реализация SPARQL (triplestore) идеальна для производительности чтения?

Я новичок в RDf и ищу базу данных RDF с открытым исходным кодом, которая имеет отличную производительность чтения. Будет около 10 миллиардов троек и более 100 запросов SPARQL в секунду. Прямо сейчас мне не нужно одновременно читать и писать в базу данных.

Я видел базы данных, зарегистрированные в Википедии (http://en.wikipedia.org/wiki/SPARQL#SPARQL_implementations), но мне нужен совет эксперта о том, какая система наиболее проверена временем. Он должен иметь лицензию Apache или такую ​​же разрешительную лицензию.


person EternallyCurious    schedule 16.03.2013    source источник


Ответы (1)


Jena и Sesame, вероятно, единственные базы данных, соответствующие вашим критериям лицензирования, но ни одна из них не масштабируется до нужного вам размера. Йена с TDB может, но я не уверен, какова будет производительность при таком масштабе. Sesame Native определенно не рассчитан на такой масштаб.

Существуют и другие базы данных с открытым исходным кодом, но они находятся под лицензией GPL, например 4store, что может соответствовать вашим критериям производительности. Но лучше всего использовать коммерческую базу данных (большинство из них имеют бесплатные ознакомительные версии); это лучший способ получить масштаб и пропускную способность чтения, которые вы хотите. Но это означает, что вам, возможно, придется платить кому-то за их тяжелую работу, облом, я знаю.

person Michael    schedule 16.03.2013
comment
Возможно, вам придется заплатить кому-то за их тяжелую работу +1 - person RobV; 19.03.2013