Я рассчитываю модельную оценку LDA с помощью Mallet в Java и ищу матрицу терминов-тем.
Расчет модели и получение матрицы темы-документа проходит успешно:
ParallelTopicModel model = ...; //... estimating the model
int numTopics = model.getNumTopics();
int numDocs = model.getData().size();
// Getting the topic-probabilities
double[][] tmDist = new double[numDocs][];
for (int i = 0; i < numTopics; i++) {
tmDist[i] = model.getTopicProbabilities(i);
}
И теперь я могу получить только первые n слов:
Object[][] topWords = model.getTopWords(5);
for(int i = 0; i < topWords.length; i++){
for(int j = 0; j < topWords[i].length; j++){
System.out.print(topWords[i][j] + " ");
}
System.out.println();
}
Единственные ответы относительно этой проблемы, которые я нашел только для этой проблемы, касаются версии Mallet для командной строки.