Обучите речь HMM от MFCC с помощью Matlab hmmtrain

Я прочитал много статей по этому поводу, но просто не понимаю, как мне действовать дальше.

Я пытаюсь создать базовую систему распознавания речи, используя функции MFCC для HMM, я использую доступные данные здесь. Для этого я использую Matlab.

Пока что я извлек векторы MFCC из речевых файлов с помощью этой библиотеки. Я не понимаю, как использовать эти функции для HMM.

Не могли бы вы объяснить, как мне тренировать HMM. Я использую реализацию hmm, найденную в Matlab. Пожалуйста, не отсылайте меня к другим библиотекам, потому что я действительно пытаюсь понять, как работает хм.

  • Как инициализировать матрицы переходов и выбросов?

  • Я предполагаю, что каждое состояние излучает определенную фонему в слове. Итак, чтобы обучить HMM, как мы должны передавать векторы MFCC?

  • Какие шаги я должен предпринять, чтобы обучить HMM?

Функции реализации MATLAB для HMM указаны здесь

Изменить: это было давно, но я полагаю, что вопрос все еще актуален по количеству просмотров, которые он получил, я решил это, код можно найти на моем GitHub


person Josyula Krishna    schedule 27.01.2015    source источник


Ответы (1)


Вы не можете использовать этот хм для тренировки речи HMM из вектора MFCC. Эта структура поддерживает только числовые последовательности, но не поддерживает векторы функций. Это простой дискретный набор инструментов HMM.

Вы должны использовать речевую библиотеку, например эту:

http://www.cs.ubc.ca/~murphyk/Software/HMM/hmm.html

person Nikolay Shmyrev    schedule 27.01.2015
comment
Спасибо за совет, я переключаюсь на панель инструментов Мерфи. Насколько я знаю, я считаю, что фонемы - это выходы каждого состояния в HMM, я не понимаю, как здесь действуют векторы MFCC. Не могли бы вы объяснить, как именно мы используем эти функции для обучения HMM? - person Josyula Krishna; 27.01.2015
comment
Вы можете прочитать руководство Рабинера по HMM, чтобы получить четкое представление о HMM cs.ubc. ca / ~ murphyk / Bayes / rabiner.pdf Функции вводятся в алгоритмы HMM. Вы вводите массив функций, а алгоритм назначает функции выходным меткам (телефонам) и дает вам вероятность такого назначения. Выравнивание выполняется без присмотра. - person Nikolay Shmyrev; 28.01.2015