Вопросы по теме 'mfcc'

сигнал во временной области в MFCC
Я читал о MFCC и распознавании речи и не понимаю одного момента. Согласно документу на этой странице http://practicalcryptography.com/miscellaneous/machine-learning/guide-mel-frequency-cepstral-coefficients-mfccs/ , что такое "сигнал временной...
334 просмотров
schedule 06.09.2021

Как построить многомерную точку данных в Python
Сначала немного предыстории: Я хочу построить Кепстральные коэффициенты Mel-Frequency для разных песен и сравнить их. Я вычисляю MFCC на протяжении всей песни, а затем усредняю ​​их, чтобы получить один массив из 13 коэффициентов. Я хочу, чтобы...
27196 просмотров
schedule 29.09.2021

Как получить MFCC со входа микрофона на android (C ++, Qt)
Я программирую приложение на Android и использую для этого Qt Creator. Ищу библиотеку, какие сэмплы сигнала, что-то вроде Aquila. Нужна технология MFCC. Буду признателен за все советы. Следующее - микрофон. Совершенно не знаю, как я получаю...
1172 просмотров
schedule 11.11.2021

Альтернатива для ifstream (c ++) при попытке прочитать файл .wav в android
Я пытаюсь вычислить коэффициенты MFCC из файлов WAV, хранящихся на SD-карте. Я использую библиотеку: https://github.com/dspavankumar/compute-mfcc Входными данными является путь к файлу wav с использованием ifstream. Мне нужно иметь доступ к...
362 просмотров
schedule 29.09.2021

Обучите речь HMM от MFCC с помощью Matlab hmmtrain
Я прочитал много статей по этому поводу, но просто не понимаю, как мне действовать дальше. Я пытаюсь создать базовую систему распознавания речи, используя функции MFCC для HMM, я использую доступные данные здесь . Для этого я использую Matlab....
3648 просмотров

Следующие шаги, которые нужно сделать с mfccs, в веб-системе распознавания голоса
Я работаю над распознаванием голоса на урду (язык, на котором говорят в Пакистане, Индии и Бангладеш), чтобы перевести речь урду в слова урду. До сих пор я ничего не делал, а просто нашел библиотеку javascript meyda для извлечения mfccs из фреймов...
429 просмотров
schedule 21.05.2022

Как использовать MFCC в Weka для классификации аудио?
Я пытаюсь разработать метод классификации аудио с использованием MFCC в Weka. Имеющиеся у меня MFCC генерируются с размером буфера 1024, поэтому для каждой аудиозаписи есть серия коэффициентов MFCC. Я хочу преобразовать эти коэффициенты в формат...
1219 просмотров

HMM — данные и формат тренировки
Я хочу реализовать HMM (скрытая модель Маркова), чтобы идентифицировать определенные слова. До сих пор мне удалось извлечь коэффициенты (MFCC) сигнала, и я задался вопросом, подходят ли эти данные для обучения HMM? Кроме того, подходит ли формат...
748 просмотров

Набор фильтров Librosa MEL с убывающими треугольниками
Я немного застрял в понимании MFCC. Из того, что я прочитал, банки фильтров мел должны быть серией треугольников, которые становятся шире, а их пики находятся в одном и том же месте. Нравится... Однако, когда я вычисляю банки фильтров...
3793 просмотров
schedule 16.06.2022

генерировать mfcc для аудио сегментов на основе аннотированного файла
Моя основная цель - передать функции mfcc в ИНС. Однако я застрял на этапе предварительной обработки данных, и мой вопрос состоит из двух частей. ИСТОРИЯ ВОПРОСА: У меня есть аудио. У меня есть текстовый файл с аннотацией и отметкой времени,...
648 просмотров
schedule 24.06.2022

TypeError: объект 'module' не вызывается. МФЦК
Работаю над проектом, основанным на распознавании говорящего с использованием python, и получаю следующую ошибку при поиске MFCC . Traceback (most recent call last): File "neh1.py", line 10, in <module> complexSpectrum =...
8030 просмотров
schedule 13.07.2022

Работа с векторами MFCC разного размера в качестве обучающих данных
Я работаю над проектом, в котором я классифицирую кашель пациента как положительный или отрицательный при определенном легочном заболевании. На данный момент у меня есть несколько случаев кашля, сегментированные из более крупных записей. Я извлек...
845 просмотров

Простой детектор слов с использованием MFCC
Я реализую программное обеспечение для распознавания речи с использованием коэффициентов Mel Frequency Cepstrum Coefficients. В частности, система должна распознавать одно указанное слово. Начиная с аудиофайла, я получаю MFCC в матрице с 12 строками...
1487 просмотров

Как получить MFCC с TarsosDSP?
Я искал везде и не мог понять, как извлечь функцию MFCC с помощью TarsosDSP на Android. Я знаю, как получить БПФ из файла. Любая помощь?
2201 просмотров
schedule 14.08.2022

Как изменить MFCC на PointList и GMM
Я делаю программу распознавания эмоций, используя пакет comirva. и у меня есть много wav-файлов об эмоциях, таких как злость, радость.. чтобы сделать gmm, сначала я извлек функции mfcc из одного из файлов argry. что я смутил, так это то, как...
838 просмотров

Создание банков фильтров MFCC аналогично примитивам производительности Intel
Я пытаюсь построить треугольные фильтры для генерации MFCC. У меня есть существующий код, основанный на IPP 6, но поскольку IPP 8 уже в разработке, я бы очень хотел получить реализацию, которая работает и не зависит от старой, теперь не...
508 просмотров
schedule 14.06.2023

Значение MFCC
У меня концептуальная проблема. Я знаю, что такое мел-шкала и что она представляет, и я знаю, что такого рода спектрограммы все еще содержат слишком много информации для того, что мне нужно. Я думаю, что если мы хотим уменьшить количество...
1553 просмотров
schedule 15.05.2023

Применение K-средних к коэффициентам MFCC для ASR
Я разделил свой аудиосигнал на кадр 20 мс с перекрытием 10 мс. В итоге у меня 500 кадров. Я вычислил коэффициенты MFCC для каждого кадра. Я хочу выполнить векторное квантование для каждого кадра, используя алгоритм K-MEAN. У меня 16...
1404 просмотров
schedule 30.12.2022

HTK - Что представляют собой MFCC модели HMM и входной WAV-файл?
При создании MFCC следуя руководству Voxforge для системы преобразования речи в текст с использованием HTK (набор инструментов скрытой марковской модели) нам необходимо определить прототип модели для наших телефонов. Я пытаюсь обдумать этот файл....
572 просмотров

Почему логарифмическое правдоподобие странно при использовании MFCC и дельта-коэффициентов
Я работаю над проектом, который требует извлечения функций MFCC из аудиопотока. Проект состоит в основном из классификации, хотя в интересах расширения нашего набора данных я работаю над алгоритмом обнаружения, чтобы изолировать части звука, которые...
96 просмотров