Я хочу получить доступ к данным Википедии для оптимизации некоторых задач НЛП, основанных на исследованиях. Я сосредоточен на поиске Java API. Я видел много Java API, например JWPL, gwtwiki, wikixmlj, Bliki Engine, Wiki.java, Stackoverfolw Question.
Я не очень понимаю, какой API мне следует использовать. Мои требования заключаются в том, чтобы найти следующую информацию о сущностях Википедии.
- Материал истории изменений.
- Полный текст статьи и метаданные статьи
- Информация об авторах
- внешние ссылки + внутренние ссылки
- страницы разговоров
- Статистика
- Отзывы пользователей
Я видел примеры из Java-проектов дома, о которых я упоминал выше. Но я не уверен, что получил всю информацию из одного API. Пожалуйста, помогите мне, у кого есть опыт обработки данных Википедии, чтобы я мог принять лучшее решение.