Здравствуйте, можно ли использовать опцию преобразования речи в текст для вызовов, при которых получатель вызова будет получать стенограмму этого вызова в реальном времени. Я пытался прочитать об услуге IBM Watson Speech to Text, но безрезультатно, поскольку в ней есть инструкции только для уже записанных данных. Может ли кто-нибудь мне помочь или это невозможно?
Android преобразование речи в текст при голосовых вызовах
comment
В реальном времени? Это будет сложно - большинство служб преобразования речи в текст требуют, чтобы вы отправляли данные на сервер для обработки. Это означает, что вам нужно будет записать данные, отправить их на сервер, а затем получить ответ. Будет задержка, и сначала вам нужно будет ее записать. И в Android нет возможности напрямую получить аудиопоток вызова, поэтому вам нужно будет записывать с микрофона и надеяться, что он будет достаточно громким / четким.
- person Gabe Sechan   schedule 01.02.2019
comment
могу я узнать, как лучше всего реализовать такую систему?
- person Xe Pueblos   schedule 01.02.2019
Ответы (1)
Вы можете транслировать аудио, но вам нужно будет использовать API веб-сокетов - https://cloud.ibm.com/apidocs/speech-to-text#recognize-audio-websockets-
Вы открываете веб-сокет, отправляете start
пакет, затем отправляете поток по мере его захвата в виде data
пакетов, завершая его пакетом stop
. Вам нужно будет установить interim_results
в true
, если вам нужен поток стенограммы.
person
chughts
schedule
05.02.2019