Согласно веб-сайту Apache, TDB "может использоваться как высокопроизводительное хранилище RDF на одном компьютере. '. Читая документацию, я не вижу, где она что-то хранит. Это просто сохранение каждого ресурса в отдельном файле в определенном каталоге, как указано в этом учебник? Если это так, то кажется, что он не будет очень хорошо масштабироваться.
Как Apache TDB хранит данные RDF?
Ответы (2)
TDB не только хранит файл в указанной папке. Содержимое файла будет проиндексировано. Для одного файла строится несколько индексов: один индекс строится для порядка SPO, другой, например, для POS и так далее (как я уже сказал, для каждой комбинации).
Эти индексы хранятся в указанной папке. В зависимости от запросов будут загружены соответствующие индексы.
Если вы добавите файл RDF в хранилище TDB, вы увидите, что создается много файлов. Хотя это означает, что фактическое содержимое файла будет сохранено несколько раз (для каждого индекса), это ускорит выполнение запроса, что часто более предпочтительно, чем минимальное использование памяти.
Документация, на которую вы ссылаетесь, включает ссылку TDB Design.
На этой странице описаны технические детали того, какие структуры данных используются внутри и как они хранятся на диске.
tdbloader
, вы заканчиваете с тройками из документа в базе данных. После первоначальной настройки вы обычно используете обновления SPARQL для вставки или удаления контента из базы данных. - person Joshua Taylor   schedule 13.01.2014