Публикации по теме 'transcription'


Автоматическое распознавание речи: Amazon Transcribe против преобразования речи в текст от Google
Мои два цента, основанные на практическом опыте использования обоих сервисов для транскрипции английского языка. С технической точки зрения, автоматическое распознавание речи (ASR) — это преобразование содержания определенного языка из одной формы в другую. Здесь исходная форма находится в аудио, а целевая форма - в текстовом. И звук, и текст на одном языке. У меня была возможность поэкспериментировать как с Amazon Transcribe, так и с сервисами преобразования речи в текст GCP..

Использование машинного обучения для обнаружения машинного обучения
На прошлой неделе Google провел свое основное мероприятие, чтобы объявить о своей новой линейке продуктов. На протяжении двухчасового мероприятия во всех их продуктах повторялась тема: МАШИННОЕ ОБУЧЕНИЕ ! От фотоаппаратов до смартфонов и новеньких домашних динамиков использовалась общая фраза: «… Мы используем машинное обучение, чтобы произвести революцию…» Итак, сколько раз Google назвал свое любимое модное словечко? 28 раз . Я не сидел и не считал сам; Я использовал Watson Speech..

Представляем транскрипцию ReiserX AI: с легкостью преобразуйте свой голос в текст
Мы рады представить вам нашу революционную службу транскрипции аудио/видео в текст, основанную на модели Whisper-large-v2. В ReiserX мы стремимся использовать потенциал искусственного интеллекта для предоставления передовых решений создателям контента, маркетологам и предприятиям. Наша служба транскрипции призвана произвести революцию в способах записи и обмена аудио- и видеоконтентом. Модель Whisper-large-v2 — это современная модель обработки естественного языка, которая была обучена..

Синтез транскриптов ASR
Что и почему Недавно я был вовлечен в работу, в которой основное внимание уделялось расшифровке звука колл-центра. Приложение было солидным; повысить прозрачность процесса/контроль качества с помощью ASR и применить аналитику поверх ASR с конечной целью более точного прогнозирования характера и объема периодов занятости в колл-центре. Однако была значительная задержка в получении звука. Организация (естественно) была привязана к стороннему программному обеспечению колл-центра, что..

Вопросы по теме 'transcription'

Используйте sphinx4 CMU для расшифровки нецифровых данных
Недавно я работал над использованием sphinx4 CMU для транскрипции и, в конечном итоге, принудительного выравнивания, то есть выравнивания аудио с его расшифровкой. Я нашел проект под названием AutoCap , который в основном делал то, что я хотел...
1606 просмотров

Какой стандарт латинизации следует использовать для улучшения транслитерации ICU4j для арабо-латиницы?
У нас есть требование транслитерировать арабский текст в латинские символы (без диакритических знаков) и отображать их для пользователей. В настоящее время для этого мы используем IBM ICU4j. API плохо транслитерирует арабский текст в правильно...
609 просмотров

Ansi-цветное редактирование файлов
Контекст Имеются файлы стенограммы взаимодействия с терминалом, полученные с помощью традиционной команды Unix «сценарий». Эти расшифровки содержат множество управляющих символов (например, пробел при редактировании команд оболочки) и множество...
565 просмотров

Как получить HTTP GET для transscribeCallback при записи звонка с глаголом ‹record›?
Как получить HTTP GET для transscribeCallback при записи вызова с помощью глагола? twiml.record({ action: '/process_recording?callID=, method: 'GET', timeout: '15', maxLength: '120', finishOnKey: '*', расшифровать: 'true', playBeep: 'true',...
578 просмотров
schedule 18.04.2023

Как просмотреть TTML и получить все время\заголовки в файл JSON
У меня есть файл ttml, содержащий подписи к видео, я хочу получить все пары время\заголовок и поместить их в файл JSON, я пробовал https://www.npmjs.com/package/ttml?activeTab=readme , но это не сработало. Любые идеи ? Спасибо
96 просмотров

Разделить расшифровку на расшифровки для разных спикеров
Например, у меня есть стенограмма с разными спикерами (new.txt): spk_0: Default transcript, containing many sentences. Such as this. spk_1: Blablabla spk_2: Blablablaba fjdslf Я хочу создать из этой стенограммы разные строки, которые содержат...
72 просмотров
schedule 08.04.2023

Можно ли сопоставить людей с расшифровкой с помощью AWS расшифровки?
Мне нужно использовать некоторые службы транскрипции для расшифровки речи. Я получаю очень хорошие результаты с расшифровкой AWS. Но мне также нужно знать, кто что говорит. Возможно ли это с помощью AWS Transcribe? Я ничего не могу найти об этом....
37 просмотров

Юникод в ASCII: стандартизированная транскрипция?
Мой другой вопрос вызвал связанный с этим вопрос: Существует ли стандартная таблица транскрипций Unicode в ASCII? Подумайте, например, о немецком ü , отображающемся на ue . Пользователь bobince упомянул в комментарии, что другие языки...
265 просмотров
schedule 11.03.2024