Статьи по теме transcription

Публикации по теме 'transcription'

Автоматическое распознавание речи: Amazon Transcribe против преобразования речи в текст от Google

Мои два цента, основанные на практическом опыте использования обоих сервисов для транскрипции английского языка. С технической точки зрения, автоматическое распознавание речи (ASR) — это преобразование содержания определенного языка из одной формы в другую. Здесь исходная форма находится в аудио, а целевая форма - в текстовом. И звук, и текст на одном языке. У меня была возможность поэкспериментировать как с Amazon Transcribe, так и с сервисами преобразования речи в текст GCP..

Использование машинного обучения для обнаружения машинного обучения

На прошлой неделе Google провел свое основное мероприятие, чтобы объявить о своей новой линейке продуктов. На протяжении двухчасового мероприятия во всех их продуктах повторялась тема: МАШИННОЕ ОБУЧЕНИЕ ! От фотоаппаратов до смартфонов и новеньких домашних динамиков использовалась общая фраза: «… Мы используем машинное обучение, чтобы произвести революцию…» Итак, сколько раз Google назвал свое любимое модное словечко? 28 раз . Я не сидел и не считал сам; Я использовал Watson Speech..

Представляем транскрипцию ReiserX AI: с легкостью преобразуйте свой голос в текст

Мы рады представить вам нашу революционную службу транскрипции аудио/видео в текст, основанную на модели Whisper-large-v2. В ReiserX мы стремимся использовать потенциал искусственного интеллекта для предоставления передовых решений создателям контента, маркетологам и предприятиям. Наша служба транскрипции призвана произвести революцию в способах записи и обмена аудио- и видеоконтентом. Модель Whisper-large-v2 — это современная модель обработки естественного языка, которая была обучена..

Синтез транскриптов ASR

Что и почему Недавно я был вовлечен в работу, в которой основное внимание уделялось расшифровке звука колл-центра. Приложение было солидным; повысить прозрачность процесса/контроль качества с помощью ASR и применить аналитику поверх ASR с конечной целью более точного прогнозирования характера и объема периодов занятости в колл-центре. Однако была значительная задержка в получении звука. Организация (естественно) была привязана к стороннему программному обеспечению колл-центра, что..

Вопросы по теме 'transcription'

Используйте sphinx4 CMU для расшифровки нецифровых данных

Недавно я работал над использованием sphinx4 CMU для транскрипции и, в конечном итоге, принудительного выравнивания, то есть выравнивания аудио с его расшифровкой. Я нашел проект под названием AutoCap , который в основном делал то, что я хотел...

1606 просмотров

30.04.2022

Какой стандарт латинизации следует использовать для улучшения транслитерации ICU4j для арабо-латиницы?

У нас есть требование транслитерировать арабский текст в латинские символы (без диакритических знаков) и отображать их для пользователей. В настоящее время для этого мы используем IBM ICU4j. API плохо транслитерирует арабский текст в правильно...

609 просмотров

java nlp transcription transliteration icu4j

29.07.2022

Ansi-цветное редактирование файлов

Контекст Имеются файлы стенограммы взаимодействия с терминалом, полученные с помощью традиционной команды Unix «сценарий». Эти расшифровки содержат множество управляющих символов (например, пробел при редактировании команд оболочки) и множество...

565 просмотров

terminal transcription emacs ansi-escape ansi-colors

20.04.2023

Как получить HTTP GET для transscribeCallback при записи звонка с глаголом ‹record›?

Как получить HTTP GET для transscribeCallback при записи вызова с помощью глагола? twiml.record({ action: '/process_recording?callID=, method: 'GET', timeout: '15', maxLength: '120', finishOnKey: '*', расшифровать: 'true', playBeep: 'true',...

578 просмотров

get callback twilio transcription

18.04.2023

Как просмотреть TTML и получить все время\заголовки в файл JSON

У меня есть файл ttml, содержащий подписи к видео, я хочу получить все пары время\заголовок и поместить их в файл JSON, я пробовал https://www.npmjs.com/package/ttml?activeTab=readme , но это не сработало. Любые идеи ? Спасибо

96 просмотров

node.js javascript caption transcription ttml

28.10.2022

Разделить расшифровку на расшифровки для разных спикеров

Например, у меня есть стенограмма с разными спикерами (new.txt): spk_0: Default transcript, containing many sentences. Such as this. spk_1: Blablabla spk_2: Blablablaba fjdslf Я хочу создать из этой стенограммы разные строки, которые содержат...

72 просмотров

python string transcription

08.04.2023

Можно ли сопоставить людей с расшифровкой с помощью AWS расшифровки?

Мне нужно использовать некоторые службы транскрипции для расшифровки речи. Я получаю очень хорошие результаты с расшифровкой AWS. Но мне также нужно знать, кто что говорит. Возможно ли это с помощью AWS Transcribe? Я ничего не могу найти об этом....

37 просмотров

amazon-web-services speaker transcription aws-transcribe

24.10.2023

Юникод в ASCII: стандартизированная транскрипция?

Мой другой вопрос вызвал связанный с этим вопрос: Существует ли стандартная таблица транскрипций Unicode в ASCII? Подумайте, например, о немецком ü , отображающемся на ue . Пользователь bobince упомянул в комментарии, что другие языки...

265 просмотров

unicode ascii transcription standards

11.03.2024