Вопросы по теме 'latent-semantic-indexing'

Бесплатные услуги LSI или API для получения связанных ключевых слов
Мне сказали, что раньше у Yahoo была бесплатная служба LSI, известная как API Yahoo Boss , которая начал оплачиваться с 20 июля, и у поисковой системы Microsoft Bing есть бесплатный сервис , который предлагает аналогичные, но не такие хорошие...
1410 просмотров

Количество тем скрытого семантического индексирования
Я использую пакет gensim для реализации LSI в корпусе. Моя цель — выявить наиболее часто встречающиеся отдельные темы, встречающиеся в корпусе. Если я не знаю количество тем в корпусе (по моим оценкам от 5 до 20), как лучше всего установить...
1897 просмотров

Интерфейс подобия LSA
Я аспирант переводоведения и сейчас работаю над диссертацией. Я использую интерфейс подобия LSA в качестве метода анализа в своей диссертации. Я занимаюсь лингвистикой, а не информатикой. Я попытался найти простой инструмент категоризации...
631 просмотров

Gensim: ValueError: не удалось создать намерение (кеш | скрыть) | необязательный массив должен иметь определенные размеры, но получил (0,)
Я пытаюсь эмулировать потоковую передачу для некоторых документов и обновлять LSI для дополнительных документов, передаваемых в потоковом режиме. Я нахожу эту ошибку: Traceback (most recent call last): File "gensimStreamGen_tutorial5.py", line...
1530 просмотров
schedule 05.10.2022

Любое скрытое семантическое индексирование?
Существует ли реализация LSI с открытым исходным кодом в Java? Я хочу использовать эту библиотеку для своего проекта. Я видел jLSI, но он реализует какую-то другую модель LSI. Я хочу стандартную модель.
8403 просмотров
schedule 03.05.2023

Профилирование пользователей для тематической рекомендательной системы
Я пытаюсь придумать рекомендательную систему на основе тем, чтобы предлагать пользователям релевантные текстовые документы. Я обучил модель скрытой семантической индексации, используя gensim, на корпусе википедии. Это позволяет мне легко...
595 просмотров

Тематическое моделирование: LDA, частота слов в каждой теме и Wordcloud
Вопрос: Как я могу вычислить и закодировать частоту слов в каждой теме? Моя цель — создать «Облако слов» из каждой темы. P.S.> У меня нет проблем с wordcloud. Из кода, burnin <- 4000 #We do not collect this. iter <- 4000 thin...
2618 просмотров