Я новичок, сейчас изучаю модель LDA (латентное распределение Дирихле). Но я столкнулся с проблемой.
Как тета извлекается из альфы?
theta ~ Директ (альфа)
Согласно моему краткому пониманию, переменная theta - это вектор с длиной K, а его компоненты представляют пропорции темы в документе. И тэты для каждого документа отличаются друг от друга. И, на уровне корпуса, альфа по-прежнему является K-вектором, тогда как тета - это матрица размером M (количество документов) на K (количество тем).
Первый вопрос: то, что я сказал выше, правда?
Второй вопрос: если это правда, по документам, как разные тэты (K-векторы) могут быть взяты из одного и того же распределения Дирихле?