Звуковое сходство компьютерного и человеческого голоса

Я ищу алгоритм для сравнения двух звуковых файлов с помощью их фонетики. Я хочу оценить какую-то оценку (например, 0: нет сходства; 100: тот же звук). Поэтому я загрузил сгенерированный компьютером и записанный человеческий голос, говорящий "Привет" в Audacity (знаю, это не так уж профессионально...) и посмотрел на волны.

https://dl.dropbox.com/s/p8o8tpsayo9xr14/hello.png (К сожалению, у меня нет возможности вставлять изображения)

Хотя оба звучат совершенно одинаково, волны на самом деле не очень совпадают.

Есть ли способ обнаружить сходство между этими двумя волнами и рассчитать упомянутый балл?


person Dominik    schedule 25.01.2013    source источник


Ответы (1)


Это проект с открытым исходным кодом, который может вас заинтересовать бесплатными инструментами и приложениями для распознавания речи. Вот еще один, который представляет собой инструментарий с открытым исходным кодом для распознавания речи. Я уверен, что если вы "duckduckgo", вы найдете другие, если они вам не по вкусу. ВАШЕ ЗДОРОВЬЕ!

person happy coder    schedule 07.02.2013