Я ищу алгоритм для сравнения двух звуковых файлов с помощью их фонетики. Я хочу оценить какую-то оценку (например, 0: нет сходства; 100: тот же звук). Поэтому я загрузил сгенерированный компьютером и записанный человеческий голос, говорящий "Привет" в Audacity (знаю, это не так уж профессионально...) и посмотрел на волны.
https://dl.dropbox.com/s/p8o8tpsayo9xr14/hello.png (К сожалению, у меня нет возможности вставлять изображения)
Хотя оба звучат совершенно одинаково, волны на самом деле не очень совпадают.
Есть ли способ обнаружить сходство между этими двумя волнами и рассчитать упомянутый балл?