Как Apache TDB хранит данные RDF?

Согласно веб-сайту Apache, TDB "может использоваться как высокопроизводительное хранилище RDF на одном компьютере. '. Читая документацию, я не вижу, где она что-то хранит. Это просто сохранение каждого ресурса в отдельном файле в определенном каталоге, как указано в этом учебник? Если это так, то кажется, что он не будет очень хорошо масштабироваться.

WildBill 13.01.2014 источник

comment

Мне не совсем ясно, о чем вы спрашиваете. RDF представляет собой представление данных на основе графа, где основной частью информации является направленное ребро (тройка), состоящее из субъекта, предиката и объекта. TDB — тройной магазин. Когда вы загружаете документ RDF, например, с помощью tdbloader, вы заканчиваете с тройками из документа в базе данных. После первоначальной настройки вы обычно используете обновления SPARQL для вставки или удаления контента из базы данных. - Joshua Taylor 13.01.2014

comment

Базы данных TDB хранятся на диске (точно так же, как и любая другая база данных, не находящаяся в оперативной памяти), поэтому при инициализации объекта Java, дающего доступ к хранилищу TDB, вы можете сделать это, указав новый объект Java на эту часть базы данных. диск (в данном случае каталог, содержащий файлы базы данных). - Joshua Taylor 13.01.2014

Ответы (2)

arrow_upward
5
arrow_downward

TDB не только хранит файл в указанной папке. Содержимое файла будет проиндексировано. Для одного файла строится несколько индексов: один индекс строится для порядка SPO, другой, например, для POS и так далее (как я уже сказал, для каждой комбинации).

Эти индексы хранятся в указанной папке. В зависимости от запросов будут загружены соответствующие индексы.

Если вы добавите файл RDF в хранилище TDB, вы увидите, что создается много файлов. Хотя это означает, что фактическое содержимое файла будет сохранено несколько раз (для каждого индекса), это ускорит выполнение запроса, что часто более предпочтительно, чем минимальное использование памяти.

hage 13.01.2014

arrow_upward
5
arrow_downward

Документация, на которую вы ссылаетесь, включает ссылку TDB Design.

На этой странице описаны технические детали того, какие структуры данных используются внутри и как они хранятся на диске.

RobV 13.01.2014

comment

Если бы это произошло, содержание SO уменьшилось бы до 10%. - Ketan; 13.07.2017

Как Apache TDB хранит данные RDF?

Ответы (2)

Вопросы по теме