Я использую LDA в маллете для изучения своих данных. У меня нет проблем с запуском, просто мне нужно иметь вероятность топовых слов (допустим, 20 слов)
Я использую этот запрос:
bin\mallet train-topics --input tutorial.mallet --num-topics 40 --optimize-interval 20 --output-state topic-state_doc_40t.gz --output-topic-keys tutorial_keys_doc_40t.txt --output-doc-topics tutorial_composition_doc_40t.txt
Я не знаю, каков будет запрос вероятностей слов.