Публикации по теме 'transcription'
Автоматическое распознавание речи: Amazon Transcribe против преобразования речи в текст от Google
Мои два цента, основанные на практическом опыте использования обоих сервисов для транскрипции английского языка.
С технической точки зрения, автоматическое распознавание речи (ASR) — это преобразование содержания определенного языка из одной формы в другую. Здесь исходная форма находится в аудио, а целевая форма - в текстовом. И звук, и текст на одном языке. У меня была возможность поэкспериментировать как с Amazon Transcribe, так и с сервисами преобразования речи в текст GCP..
Использование машинного обучения для обнаружения машинного обучения
На прошлой неделе Google провел свое основное мероприятие, чтобы объявить о своей новой линейке продуктов. На протяжении двухчасового мероприятия во всех их продуктах повторялась тема: МАШИННОЕ ОБУЧЕНИЕ !
От фотоаппаратов до смартфонов и новеньких домашних динамиков использовалась общая фраза: «… Мы используем машинное обучение, чтобы произвести революцию…» Итак, сколько раз Google назвал свое любимое модное словечко? 28 раз .
Я не сидел и не считал сам; Я использовал Watson Speech..
Представляем транскрипцию ReiserX AI: с легкостью преобразуйте свой голос в текст
Мы рады представить вам нашу революционную службу транскрипции аудио/видео в текст, основанную на модели Whisper-large-v2. В ReiserX мы стремимся использовать потенциал искусственного интеллекта для предоставления передовых решений создателям контента, маркетологам и предприятиям. Наша служба транскрипции призвана произвести революцию в способах записи и обмена аудио- и видеоконтентом.
Модель Whisper-large-v2 — это современная модель обработки естественного языка, которая была обучена..
Синтез транскриптов ASR
Что и почему
Недавно я был вовлечен в работу, в которой основное внимание уделялось расшифровке звука колл-центра. Приложение было солидным; повысить прозрачность процесса/контроль качества с помощью ASR и применить аналитику поверх ASR с конечной целью более точного прогнозирования характера и объема периодов занятости в колл-центре.
Однако была значительная задержка в получении звука. Организация (естественно) была привязана к стороннему программному обеспечению колл-центра, что..
Вопросы по теме 'transcription'
Используйте sphinx4 CMU для расшифровки нецифровых данных
Недавно я работал над использованием sphinx4 CMU для транскрипции и, в конечном итоге, принудительного выравнивания, то есть выравнивания аудио с его расшифровкой.
Я нашел проект под названием AutoCap , который в основном делал то, что я хотел...
1606 просмотров
schedule
30.04.2022
Какой стандарт латинизации следует использовать для улучшения транслитерации ICU4j для арабо-латиницы?
У нас есть требование транслитерировать арабский текст в латинские символы (без диакритических знаков) и отображать их для пользователей.
В настоящее время для этого мы используем IBM ICU4j. API плохо транслитерирует арабский текст в правильно...
609 просмотров
schedule
29.07.2022
Ansi-цветное редактирование файлов
Контекст
Имеются файлы стенограммы взаимодействия с терминалом, полученные с помощью традиционной команды Unix «сценарий».
Эти расшифровки содержат множество управляющих символов (например, пробел при редактировании команд оболочки) и множество...
565 просмотров
schedule
20.04.2023
Как получить HTTP GET для transscribeCallback при записи звонка с глаголом ‹record›?
Как получить HTTP GET для transscribeCallback при записи вызова с помощью глагола?
twiml.record({ action: '/process_recording?callID=, method: 'GET', timeout: '15', maxLength: '120', finishOnKey: '*', расшифровать: 'true', playBeep: 'true',...
578 просмотров
schedule
18.04.2023
Как просмотреть TTML и получить все время\заголовки в файл JSON
У меня есть файл ttml, содержащий подписи к видео, я хочу получить все пары время\заголовок и поместить их в файл JSON, я пробовал https://www.npmjs.com/package/ttml?activeTab=readme , но это не сработало. Любые идеи ? Спасибо
96 просмотров
schedule
28.10.2022
Разделить расшифровку на расшифровки для разных спикеров
Например, у меня есть стенограмма с разными спикерами (new.txt):
spk_0: Default transcript, containing many sentences. Such as this.
spk_1: Blablabla
spk_2: Blablablaba fjdslf
Я хочу создать из этой стенограммы разные строки, которые содержат...
72 просмотров
schedule
08.04.2023
Можно ли сопоставить людей с расшифровкой с помощью AWS расшифровки?
Мне нужно использовать некоторые службы транскрипции для расшифровки речи. Я получаю очень хорошие результаты с расшифровкой AWS. Но мне также нужно знать, кто что говорит. Возможно ли это с помощью AWS Transcribe? Я ничего не могу найти об этом....
37 просмотров
schedule
24.10.2023
Юникод в ASCII: стандартизированная транскрипция?
Мой другой вопрос вызвал связанный с этим вопрос:
Существует ли стандартная таблица транскрипций Unicode в ASCII? Подумайте, например, о немецком ü , отображающемся на ue .
Пользователь bobince упомянул в комментарии, что другие языки...
265 просмотров
schedule
11.03.2024