Вопросы по теме 'latent-semantic-indexing'
Бесплатные услуги LSI или API для получения связанных ключевых слов
Мне сказали, что раньше у Yahoo была бесплатная служба LSI, известная как API Yahoo Boss , которая начал оплачиваться с 20 июля, и у поисковой системы Microsoft Bing есть бесплатный сервис , который предлагает аналогичные, но не такие хорошие...
1410 просмотров
schedule
14.04.2022
Количество тем скрытого семантического индексирования
Я использую пакет gensim для реализации LSI в корпусе. Моя цель — выявить наиболее часто встречающиеся отдельные темы, встречающиеся в корпусе.
Если я не знаю количество тем в корпусе (по моим оценкам от 5 до 20), как лучше всего установить...
1897 просмотров
schedule
20.04.2022
Интерфейс подобия LSA
Я аспирант переводоведения и сейчас работаю над диссертацией. Я использую интерфейс подобия LSA в качестве метода анализа в своей диссертации. Я занимаюсь лингвистикой, а не информатикой. Я попытался найти простой инструмент категоризации...
631 просмотров
schedule
24.08.2022
Gensim: ValueError: не удалось создать намерение (кеш | скрыть) | необязательный массив должен иметь определенные размеры, но получил (0,)
Я пытаюсь эмулировать потоковую передачу для некоторых документов и обновлять LSI для дополнительных документов, передаваемых в потоковом режиме. Я нахожу эту ошибку:
Traceback (most recent call last):
File "gensimStreamGen_tutorial5.py", line...
1530 просмотров
schedule
05.10.2022
Любое скрытое семантическое индексирование?
Существует ли реализация LSI с открытым исходным кодом в Java? Я хочу использовать эту библиотеку для своего проекта. Я видел jLSI, но он реализует какую-то другую модель LSI. Я хочу стандартную модель.
8403 просмотров
schedule
03.05.2023
Профилирование пользователей для тематической рекомендательной системы
Я пытаюсь придумать рекомендательную систему на основе тем, чтобы предлагать пользователям релевантные текстовые документы.
Я обучил модель скрытой семантической индексации, используя gensim, на корпусе википедии. Это позволяет мне легко...
595 просмотров
schedule
26.01.2023
Тематическое моделирование: LDA, частота слов в каждой теме и Wordcloud
Вопрос: Как я могу вычислить и закодировать частоту слов в каждой теме? Моя цель — создать «Облако слов» из каждой темы.
P.S.> У меня нет проблем с wordcloud.
Из кода,
burnin <- 4000 #We do not collect this.
iter <- 4000
thin...
2618 просмотров
schedule
26.11.2022