Вопросы по теме 'mallet'

Как создать таблицу путем реструктуризации выходного файла MALLET?
Я использую MALLET для анализа темы, результаты которого выводятся в текстовые файлы ("themes.txt" ) из нескольких тысяч строк и сотни или около того строк, где каждая строка состоит из переменных, разделенных табуляцией, например: Num1 text1...
613 просмотров
schedule 17.10.2021

Различные распределения тем для одних и тех же данных с моделированием тем с помощью молотка
Я использую Mallet topic modeling и обучил модель. Сразу после обучения распечатываю раздачу тем для одного из документов обучающего набора и сохраняю. Затем я пробую тот же документ, что и тестовый набор, и пропускаю его по тем же каналам и так...
96 просмотров
schedule 04.11.2021

Ошибка молоточка Gensim? Не удается загрузить сохраненную модель более одного раза
Я пытаюсь загрузить сохраненный молоток gensim lda: ldamallet = gensim.models.wrappers.LdaMallet(mallet_path, corpus=corpus, num_topics=n_topics,id2word=id2word) ldamallet.save('ldamallet') При тестировании этого для нового запроса (с...
953 просмотров
schedule 26.10.2021

Моделирование тем с помощью Mallet - параметр вывода тематических ключей
У меня есть дополнительный вопрос к заданному здесь: Моделирование тем Mallet - тема параметр вывода ключей Я надеюсь, что смогу получить более подробное объяснение этого вопроса, потому что у меня проблемы с пониманием этих чисел в выходных...
64 просмотров
schedule 22.10.2021

темы поезда bin/молотка получают разные результаты в каждом случае
Когда я запускаю команду bin\mallet train-topics --input input.tutorial.mallet --num-topics 40 --num-iterations 100 --optimize-interval 50 --optimize-burn-in 200 --output- состояние input.gz --output-topic-keys inputkeys.txt --output-doc-topics...
616 просмотров
schedule 26.03.2022

Почему MALLET LDA должен сохранять последовательность?
В документации MALLET для обучения модели темы требуется тег --keep-sequence (подробности: http://mallet.cs.umass.edu/topics.php ) Однако, насколько мне известно, обычное LDA-моделирование использует документы как набор слов, поскольку включение...
451 просмотров
schedule 18.05.2022

Как бороться с пробелами в строке cmd в Mallet?
Если я запускаю Mallet в cmd для пути без пробелов, все в порядке. Маллет import-dir --input E:\Mallet\mallet-2.0.8RC3\sample-data\web\en --output E:\Mallet\topicout\weben.mallet --keep-sequence --remove-stopwords Выше нормально. Я копирую...
42 просмотров
schedule 29.06.2022

Визуализация PyLDAvis не соответствует сгенерированным темам
Я использую PyLDAvis для визуализации результатов LDA от Mallet. Прежде чем я смогу это сделать, мне нужна оболочка библиотеки gensim: model = gensim.models.wrappers.ldamallet.malletmodel2ldamodel(model_list[8]) Когда я печатаю найденные...
450 просмотров
schedule 26.06.2022

Как использовать Mallet для NER
Я новичок в предмете NLP и попросил выполнить распознавание именованных сущностей (NER) с помощью Mallet. У меня есть текст, и я даю вектор признаков для каждого слова в нем. Я хотел бы обучить модель, которую позже я могу проверить на новом...
5239 просмотров
schedule 02.07.2022

как получить вероятность слов тем в Mallet
Я использую LDA в маллете для изучения своих данных. У меня нет проблем с запуском, просто мне нужно иметь вероятность топовых слов (допустим, 20 слов) Я использую этот запрос: bin\mallet train-topics --input tutorial.mallet --num-topics 40...
759 просмотров
schedule 09.07.2022

Странные значения недоумения модели LDA, обученной с помощью MALLET
Я обучил модель LDA с помощью MALLET на части дампа данных переполнения стека и разделил 70/30 для обучающих и тестовых данных. Но значения недоумения странные, потому что для тестовой выборки они ниже, чем для обучающей выборки. Как это возможно?...
681 просмотров
schedule 14.08.2022

rJava выдает исключение NullPointerException в .jcall
Я пытаюсь запустить стандартный метод загрузки корпуса в пакете mallet R, а точнее instance <- mallet.import(names(txt$CELEX), txt$TEXT, stoplist.file = "stopwords.en.txt", token.regexp = "\\p{L}[\\p{L}\\p{P}]+\\p{L}") Затем я получаю...
2604 просмотров
schedule 28.08.2022

Mallet HierarchicalLDATUI выдает исключение NullPointerException для определенных файлов
В последние несколько дней я начал использовать Маллет. Меня особенно интересует использование иерархической тематической модели, такой как HLDA или HPAM. При импорте образцов файлов данных и запуске их с использованием класса...
104 просмотров
schedule 27.09.2022

Получение словарно-тематической матрицы из LDA-модели в Mallet
Я рассчитываю модельную оценку LDA с помощью Mallet в Java и ищу матрицу терминов-тем . Расчет модели и получение матрицы темы-документа проходит успешно: ParallelTopicModel model = ...; //... estimating the model int numTopics =...
1070 просмотров
schedule 06.10.2022

о выводе lda
Прямо сейчас я использую инструмент моделирования тем LDA из пакета MALLET, чтобы определять темы в моих документах. Поначалу все нормально, 20 тем достал. Однако когда я пытаюсь вывести новый документ с помощью модели, результат несколько сбивает с...
2636 просмотров
schedule 09.09.2023

Обучение классификатора в молотке
у меня есть CSV-файл в следующем формате: productname, обзор продукта теперь, используя молоток, я должен обучить классификатор, чтобы, если в качестве входных данных дается тестовый набор данных, содержащий обзоры продуктов, он должен был сказать...
2360 просмотров
schedule 20.11.2022

SimpleTagger на основе CRF с молотком
Пожалуйста, я хочу запустить класс Simple Tagger в маллете. Я работаю с затмением. Мне нужно только знать порядок аргументов для ввода. Это ссылка объяснила каждый аргумент, но не порядок (args[0], args 1 и т. д.) Кроме того, у вас есть...
409 просмотров
schedule 27.08.2023

Передача строк Python в Mallet для тематического моделирования
Я создаю корпус текстов, собранных вместе с некоторыми метаданными из HTML с помощью BeautifulSoup. Было бы очень полезно, если бы я мог вызывать Mallet из Python и моделировать темы из строк Python, а не из текстовых файлов в каталоге. Таким...
1068 просмотров
schedule 04.12.2022

Как загрузить и использовать CRF, обученный с помощью Mallet?
Я обучил CRF, используя GenericAcrfTui , он записывает ACRF в файл. Я не совсем уверен, как загрузить и использовать обученную CRF, но import cc.mallet.grmm.learning.ACRF; import cc.mallet.util.FileUtils; ACRF c = (ACRF)...
1712 просмотров
schedule 12.10.2022

Пример модели темы Mallet не может быть скомпилирован
Я хочу скомпилировать маллет на своей Java (вместо командной строки), поэтому я включаю банку в свой проект и цитирую код примера из: http://mallet.cs.umass.edu/topics-devel.php , однако, когда я запускаю этот код, возникает ошибка: Exception in...
2071 просмотров
schedule 22.07.2023