Я прочитал много статей по этому поводу, но просто не понимаю, как мне действовать дальше.
Я пытаюсь создать базовую систему распознавания речи, используя функции MFCC для HMM, я использую доступные данные здесь. Для этого я использую Matlab.
Пока что я извлек векторы MFCC из речевых файлов с помощью этой библиотеки. Я не понимаю, как использовать эти функции для HMM.
Не могли бы вы объяснить, как мне тренировать HMM. Я использую реализацию hmm, найденную в Matlab. Пожалуйста, не отсылайте меня к другим библиотекам, потому что я действительно пытаюсь понять, как работает хм.
Как инициализировать матрицы переходов и выбросов?
Я предполагаю, что каждое состояние излучает определенную фонему в слове. Итак, чтобы обучить HMM, как мы должны передавать векторы MFCC?
Какие шаги я должен предпринять, чтобы обучить HMM?
Функции реализации MATLAB для HMM указаны здесь
Изменить: это было давно, но я полагаю, что вопрос все еще актуален по количеству просмотров, которые он получил, я решил это, код можно найти на моем GitHub