Как добавить ссылку на PDF-файлы с полным текстом на веб-сайт MediaWiki

У меня есть веб-сайт MediaWiki, на котором есть около 1000 дополнительных файлов, которые находятся в веб-каталогах, которые автоматически индексируются. Я бы хотел, чтобы эти страницы появились в индексе MediaWiki. Я придумал два подхода:

Напишите подключаемый модуль mediawiki, который создает страницу для каждого каталога с маркированным списком для каждого элемента и ссылкой для загрузки объекта.
Напишите программу на Python, которая использует API mediaWiki для создания страницы mediawiki для каждого элемента с полными метаданными. Затем я могу извлечь текст и поместить извлеченный текст на страницу, а также предварительно отформатированный текст MediaWiki.

Однако некоторые из этих документов довольно длинные, поэтому я думаю, что другим подходом будет извлечение текста из PDF-файлов и помещение его в индекс MediaWiki. Для многостраничных PDF-файлов может иметь смысл загружать (автоматически?) миниатюру первой страницы PDF-файла или даже всех страниц.

Так как же правильно ссылаться на PDF-файлы с полным текстом на веб-сайте MediaWiki?

mediawiki mediawiki-extensions

vy32 14.10.2019 источник

Ответы (1)

arrow_upward
0
arrow_downward

Используйте PdfHandler, чтобы предоставить метаданные файла PDF для поиска и загрузить эти документы в виде файлов (используя например, Pywikibot или importImages.php).

Tgr 14.10.2019

Как добавить ссылку на PDF-файлы с полным текстом на веб-сайт MediaWiki

Ответы (1)

Вопросы по теме