Как я могу графически изобразить интонацию образца голоса?

Я хочу создать приложение для iOS, которое позволяет мне графически отображать интонацию (подъем и падение высоты тона голоса) аудиообразца, прочитанного пользователем. Интонация очень важна в различных языках по всему миру, и это была бы попытка практиковать интонацию, а также произношение.

Я не очень разбираюсь в мире речи/аудио технологий, так что мне нужно? Существуют ли библиотеки, установленные вместе с Cocoa-touch, которые дают мне возможность доступа к нужным мне данным из образца голоса? Что именно я собираюсь захватить?

Если у кого-то есть идея технологии, которую мне нужно будет использовать, я был бы признателен за точку в правильном направлении.

Спасибо!


person Lizza    schedule 29.08.2012    source источник


Ответы (1)


То, что вы ищете, называется формантным анализом.

Форманты – это, по сути, спектральные пики произносимых звуков. Они перечислены в порядке частоты, например, f1, f2 и т. д. Мне кажется, что вы хотите построить график f1.

Формантный анализ лежит в основе распознавания речи, обычно f1 и f2 достаточно, чтобы различать гласные. Я бы порекомендовал вам выполнить поиск по алгоритмам формантного анализа и взять его оттуда.

Удачи :)

person Blanka    schedule 30.08.2012