Я аспирант переводоведения и сейчас работаю над диссертацией. Я использую интерфейс подобия LSA в качестве метода анализа в своей диссертации. Я занимаюсь лингвистикой, а не информатикой. Я попытался найти простой инструмент категоризации документов LSA, но не смог его найти. Пробовал играть с Gensim, не получилось. Я думаю, что моя проблема заключается в том, чтобы связать мой корпус (файлы txt) с инструментом Gensim для проведения анализа (я не знаю, как выполнить этот шаг). Я был бы очень признателен, если бы кто-нибудь мог помочь мне с анализом или указать мне какой-либо инструмент или простые учебные пособия, чтобы сделать это с помощью Gensim.
Я хочу сделать следующее: я хочу применить запросы документ-документ, чтобы получить 5 наиболее релевантных документов из корпуса в документ запроса.
- У меня есть 15 документов запроса
- У меня есть один корпус (150 текстов) Тексты рассказов
Я в отчаянии, и я не решался разместить этот вопрос здесь. Я уверен, что применение АЛП в переводоведении расширило бы поле, и это заставляет меня более настойчиво искать способ провести свой анализ.