Код SSML в преобразовании текста в речь Curl IBM Watson

Я пытаюсь использовать IBM Watson Text to Speech, потому что мне нужен аудиофайл для вставки в видео, но я вообще не разработчик! Просматривая скудный учебник, представленный на облачном веб-сайте IBM, я понял, как получить аудиофайл с помощью curl. Но я не могу найти способ использовать возможности SSML для изменения голоса. Я не понимаю, где в коде нужно указывать теги. Вот код, который я использую, он работает для создания аудиофайла. Куда мне вставить теги, чтобы настроить голос? ... Любая помощь будет более чем приветствоваться! Спасибо заранее

curl -X POST -u "credential OK":"credential ok" \        
--header "Content-Type: application/json" \        
--header "Accept: audio/mp3" \        
--data '{"text": "The visceral leishmaniasis, also known as kala-azar is characterized by irregular bouts of fever, substantial weight loss, swelling of the spleen and liver, and anaemia. Visceral leishmaniasis is fatal in over 95% of cases if left untreated."}' \        
--output Essai.mp3 \        
"https://stream.watsonplatform.net/text-to-speech/api/v1/synthesize?voice=en-US_AllisonVoice"\   

person AMarie Lab    schedule 18.10.2018    source источник


Ответы (2)


Вы помещаете теги SSML вокруг текста, к которому его нужно применить.

например. для вашего примера

--data '{"text": "<express-as type='GoodNews'> The visceral leishmaniasis, also known as kala-azar </express-as> is characterized by irregular bouts of fever, substantial weight loss, swelling of the spleen and liver, and anaemia. Visceral leishmaniasis is fatal in over 95% of cases if left untreated."}'
person chughts    schedule 24.10.2018
comment
Спасибо за ваш вклад. Я попробовал, но он вернул мне пустой аудиофайл. Есть идеи, почему? - person AMarie Lab; 25.10.2018
comment
Проверьте свой вывод на наличие ошибок. Возможно, вы видите, что что-то в строках ‹express-as› не поддерживается в текущем голосе. - person chughts; 26.10.2018
comment
Я не вижу ошибок в выводе ... Я не знаю ... он создает файл, но файл пустой. SSML должен поддерживаться выбранным голосом - person AMarie Lab; 26.10.2018

Я знаю, что этот ответ запоздал, но он может помочь кому-то еще с той же проблемой.

--data "{\"text\": \"<voice-transformation type='Custom' breathiness='35%' pitch='-80%' pitch_range='60%' glottal_tension='-40%' ><p><s>The visceral leishmaniasis, <break strength='500ms'></break>also known as kala-azar, <break strength='500ms'></break> <express-as type='Uncertainty'>is characterized by irregular bouts of fever, substantial weight loss, swelling of the spleen and liver, and anaemia.</express-as></s> <s>Visceral leishmaniasis is fatal in over 95% of cases if left untreated.</s></p></voice-transformation>\"}" \

Я считаю, что причина, по которой пример, предоставленный chughts, не сработал, может быть из-за неправильного экранирования кавычек в объекте JASON. * Также обратите внимание, что элемент express-as работает только с en-US_AllisonVoice.

Лично я не могу сказать разницу в голосе, используя любой из вариантов типа элемента express-as. FWIW, я предпочитаю en-US_LisaV3Voice, но вы не можете использовать голосовые преобразования с голосами V3.

person skrantz    schedule 08.10.2019