Я использую PyLDAvis для визуализации результатов LDA от Mallet.
Прежде чем я смогу это сделать, мне нужна оболочка библиотеки gensim:
model = gensim.models.wrappers.ldamallet.malletmodel2ldamodel(model_list[8])
Когда я печатаю найденные темы, они упорядочены от 0 до 10.
Однако, когда я использую pyLDAvis для визуализации тем, порядок тем (0-10) не совпадает с печатными темами.
Пример:
(5,
'0.042*"euro" + 0.030*"smartpho" + 0.022*"camera" + 0.020*"display" + '
'0.018*"model" + 0.016*"picture" + 0.012*"price" + 0.010*"android"')
Как видите, эта тема посвящена смартфонам.
Однако, когда я визуализирую модель с помощью pyLDAvis, тема 5 касается не смартфонов, а другой темы (например, автомобилей). Тема смартфона уже не 5, а тема 1.
Пример1:
Это известная ошибка или это норма? Кто-нибудь может помочь?