Как Apache TDB хранит данные RDF?

Согласно веб-сайту Apache, TDB "может использоваться как высокопроизводительное хранилище RDF на одном компьютере. '. Читая документацию, я не вижу, где она что-то хранит. Это просто сохранение каждого ресурса в отдельном файле в определенном каталоге, как указано в этом учебник? Если это так, то кажется, что он не будет очень хорошо масштабироваться.


person WildBill    schedule 13.01.2014    source источник
comment
Мне не совсем ясно, о чем вы спрашиваете. RDF представляет собой представление данных на основе графа, где основной частью информации является направленное ребро (тройка), состоящее из субъекта, предиката и объекта. TDB — тройной магазин. Когда вы загружаете документ RDF, например, с помощью tdbloader, вы заканчиваете с тройками из документа в базе данных. После первоначальной настройки вы обычно используете обновления SPARQL для вставки или удаления контента из базы данных.   -  person Joshua Taylor    schedule 13.01.2014
comment
Базы данных TDB хранятся на диске (точно так же, как и любая другая база данных, не находящаяся в оперативной памяти), поэтому при инициализации объекта Java, дающего доступ к хранилищу TDB, вы можете сделать это, указав новый объект Java на эту часть базы данных. диск (в данном случае каталог, содержащий файлы базы данных).   -  person Joshua Taylor    schedule 13.01.2014


Ответы (2)


TDB не только хранит файл в указанной папке. Содержимое файла будет проиндексировано. Для одного файла строится несколько индексов: один индекс строится для порядка SPO, другой, например, для POS и так далее (как я уже сказал, для каждой комбинации).

Эти индексы хранятся в указанной папке. В зависимости от запросов будут загружены соответствующие индексы.

Если вы добавите файл RDF в хранилище TDB, вы увидите, что создается много файлов. Хотя это означает, что фактическое содержимое файла будет сохранено несколько раз (для каждого индекса), это ускорит выполнение запроса, что часто более предпочтительно, чем минимальное использование памяти.

person hage    schedule 13.01.2014

Документация, на которую вы ссылаетесь, включает ссылку TDB Design.

На этой странице описаны технические детали того, какие структуры данных используются внутри и как они хранятся на диске.

person RobV    schedule 13.01.2014
comment
Если бы это произошло, содержание SO уменьшилось бы до 10%. - person Ketan; 13.07.2017