Обнаружение голоса в C #

Я ищу простую библиотеку обнаружения голоса в реальном времени C #. На входе должен быть аудиопоток, а на выходе - «человеческий голос» или «не человеческий голос». У меня нет знаний в области распознавания речи или обработки сигналов, и я буду признателен за любую помощь.


person Uri Goren    schedule 28.07.2012    source источник
comment
Как вы собираетесь определить, что такое человеческий голос, а что нет? Это непростая проблема, но если бы вы могли указать некоторые параметры того, что вы пытаетесь достичь, мы могли бы предложить направление.   -  person Brad    schedule 28.07.2012
comment
Я пытаюсь измерить, как долго говорящий говорит и как долго у него паузы.   -  person Uri Goren    schedule 28.07.2012
comment
На похожий, но не идентичный вопрос был дан ответ здесь, возможно, эта информация будет полезна.   -  person Eli    schedule 06.08.2012


Ответы (1)


Взгляните на ответ "Обнаружение тишины звука в файлах WAV с использованием C # ". Я предполагаю, что ввод - это файл WAV. Если нет, укажите формат аудиопотока или если вы собираетесь принимать входные данные напрямую с микрофона. Если вы можете измерить количество тишины в аудиопотоке и знаете продолжительность аудиопотока, вы можете рассчитать время разговора. Ссылка в ответе мертва, но если вы перейдете на codeproject.com и выполните поиск по «C # wave form», вы увидите ряд проектов, которые показывают вам, как интерпретировать файлы wav и управлять ими. Обнаружение тишины может быть немного субъективным при наличии фонового шума. Вам нужно будет выбрать минимальный порог громкости для тишины, когда все, что ниже, считается тишиной.

person Kevin Junghans    schedule 30.07.2012