Я ищу простую библиотеку обнаружения голоса в реальном времени C #. На входе должен быть аудиопоток, а на выходе - «человеческий голос» или «не человеческий голос». У меня нет знаний в области распознавания речи или обработки сигналов, и я буду признателен за любую помощь.
Обнаружение голоса в C #
Ответы (1)
Взгляните на ответ "Обнаружение тишины звука в файлах WAV с использованием C # ". Я предполагаю, что ввод - это файл WAV. Если нет, укажите формат аудиопотока или если вы собираетесь принимать входные данные напрямую с микрофона. Если вы можете измерить количество тишины в аудиопотоке и знаете продолжительность аудиопотока, вы можете рассчитать время разговора. Ссылка в ответе мертва, но если вы перейдете на codeproject.com и выполните поиск по «C # wave form», вы увидите ряд проектов, которые показывают вам, как интерпретировать файлы wav и управлять ими. Обнаружение тишины может быть немного субъективным при наличии фонового шума. Вам нужно будет выбрать минимальный порог громкости для тишины, когда все, что ниже, считается тишиной.