Значение MFCC

У меня концептуальная проблема.

Я знаю, что такое мел-шкала и что она представляет, и я знаю, что такого рода спектрограммы все еще содержат слишком много информации для того, что мне нужно.

Я думаю, что если мы хотим уменьшить количество информации спектрограммы, мы используем MFCC.

Но я действительно не понимаю, что такое MFCC и что он собой представляет? Я использую матрицу MFCC в процессе распознавания речи, но я не понимаю, что представляют все числа внутри этого вектора.

Массив 13x130, и я не знаю, что означают все эти числа с плавающей запятой. Я понял, что чем длиннее моя звуковая дорожка, тем больше моя матрица (например, 13х250, 13х400).

Надеюсь, я ясно выразился.


person Anthos89    schedule 26.11.2015    source источник
comment
Эта статья выглядит как хорошее начало practicalcryptography.com/ разное/машинное обучение/ надеюсь, это поможет вам!   -  person Maantje    schedule 27.11.2015
comment
Спасибо, это было полезно, но я чувствую, что не понимаю полной практической концепции. Вектор признаков MFCC описывает только огибающую спектра мощности одного кадра, но похоже, что речь также будет иметь информацию в динамике, т.е. каковы траектории коэффициентов MFCC во времени, каковы траектории MFCC?   -  person Anthos89    schedule 27.11.2015