Android преобразование речи в текст при голосовых вызовах

Здравствуйте, можно ли использовать опцию преобразования речи в текст для вызовов, при которых получатель вызова будет получать стенограмму этого вызова в реальном времени. Я пытался прочитать об услуге IBM Watson Speech to Text, но безрезультатно, поскольку в ней есть инструкции только для уже записанных данных. Может ли кто-нибудь мне помочь или это невозможно?


person Xe Pueblos    schedule 01.02.2019    source источник
comment
В реальном времени? Это будет сложно - большинство служб преобразования речи в текст требуют, чтобы вы отправляли данные на сервер для обработки. Это означает, что вам нужно будет записать данные, отправить их на сервер, а затем получить ответ. Будет задержка, и сначала вам нужно будет ее записать. И в Android нет возможности напрямую получить аудиопоток вызова, поэтому вам нужно будет записывать с микрофона и надеяться, что он будет достаточно громким / четким.   -  person Gabe Sechan    schedule 01.02.2019
comment
могу я узнать, как лучше всего реализовать такую ​​систему?   -  person Xe Pueblos    schedule 01.02.2019


Ответы (1)


Вы можете транслировать аудио, но вам нужно будет использовать API веб-сокетов - https://cloud.ibm.com/apidocs/speech-to-text#recognize-audio-websockets-

Вы открываете веб-сокет, отправляете start пакет, затем отправляете поток по мере его захвата в виде data пакетов, завершая его пакетом stop. Вам нужно будет установить interim_results в true, если вам нужен поток стенограммы.

person chughts    schedule 05.02.2019