Есть ли какой-нибудь бесплатный совин, который может рассуждать, не загружая все данные в память?

Я использую Jena и TDB для хранения RDF, и я хочу сделать некоторые выводы по нему. Но данные RDF большие, и сове-разумнику Jena приходится загружать все данные в память. Итак, я хочу найти одного рассудителя, который может рассуждать, не загружая все данные в память, есть ли такой?

inference owl jena

Wang Ruiqi 25.04.2012 источник

comment

Насколько велики ваши данные? Просто любопытно... - castagna 26.04.2012

Ответы (3)

arrow_upward
2
arrow_downward

Если вы готовы взять подмножество OWL, есть вещи, которые вы можете делать в режиме потоковой обработки, не загружая все ваши RDF-данные в память, и которые материализуют все предполагаемые тройки.

В качестве примера взгляните на команду infer RIOT:

http://incubator.apache.org/jena/documentation/io/riot.html#inference

Исходный код здесь:

Тривиально взять вывод RIOT и запустить его параллельно с чем-то вроде MapReduce, пример здесь:

https://github.com/castagna/tdbloader4/blob/f5363fa49d16a04a362898c1a5084ade620ee81b/src/main/java/org/apache/jena/tdbloader4/InferDriver.java

Другой другой подход, который использует MapReduce для применения правил RDFS и OWL ter Horst и материализации всех производных операторов, находится здесь:

http://www.few.vu.nl/~jui200/webpie.html

Возможно, вы можете просмотреть интересующие вас части OWL и проверить, сможете ли вы сделать это в потоковом режиме. Если это так, вы можете взять вывод RIOT и расширить его, добавив интересующие вас части OWL. Это было бы хорошим вкладом в Apache Jena (обратитесь в список рассылки jena-dev, если вы хотите это сделать) .

WebPIE — умный и интересный проект, но, как видите, немного более сложный и исследовательский проект (со всеми вытекающими последствиями с точки зрения долгосрочной поддержки и сопровождения). Однако, если вам нужна/нужна OWL ter Horst, WebPIE подойдет. Вы даже можете приложить усилия, разветвить WebPIE и внести свой вклад в проект с открытым исходным кодом, если другие заинтересованы в его использовании.

Возможно, вам будет интересно взглянуть также на Ymris (но он сейчас спит... zzzzz):

https://svn.apache.org/repos/asf/incubator/jena/Import/Jena-SVN/Ymris/trunk/

castagna 26.04.2012

arrow_upward
3
arrow_downward

Не совсем. Рассуждения DL сложны в вычислительном отношении даже на малых масштабах. С много данных это просто не будет работать с существующими подходами. Выполнение этого во вторичном хранилище все еще остается открытой исследовательской проблемой.

Однако для решения этой проблемы существуют различные профили OWL. Все они имеют разную вычислительную сложность, и все они «проще», чем DL, что делает их гораздо более удобными для рассуждений в масштабе. В частности, QL предназначен для рассуждения о времени запроса, которое, по моему опыту, имеет тенденцию занимать очень мало памяти, а RL может быть реализован с помощью стандартного обработчика правил.

Поэтому, если вам не нужно использовать DL, я бы выбрал инструмент, который поддерживает один из профилей, и вы должны получить от этого довольно хорошие результаты.

Для справки вы можете найти этот документ о вычислительных сложностях различных OWL. диалекты интересные.

Michael 25.04.2012

comment

На самом деле, данные RDF - это скоси, я не знаю, может ли это быть аргументировано QL - Wang Ruiqi; 28.04.2012

arrow_upward
0
arrow_downward

Вы можете попробовать GRAKN.AI, они в режиме реального времени анализируют сохраненные данные в распределенных системах.

user7420209 27.04.2018

Есть ли какой-нибудь бесплатный совин, который может рассуждать, не загружая все данные в память?

Ответы (3)

Вопросы по теме