Статьи по теме mfcc [c++, mfcc, python, matplotlib, plot]

Вопросы по теме 'mfcc'

Я читал о MFCC и распознавании речи и не понимаю одного момента. Согласно документу на этой странице http://practicalcryptography.com/miscellaneous/machine-learning/guide-mel-frequency-cepstral-coefficients-mfccs/ , что такое "сигнал временной...

334 просмотров

c++ mfcc

06.09.2021

Как построить многомерную точку данных в Python

Сначала немного предыстории: Я хочу построить Кепстральные коэффициенты Mel-Frequency для разных песен и сравнить их. Я вычисляю MFCC на протяжении всей песни, а затем усредняю их, чтобы получить один массив из 13 коэффициентов. Я хочу, чтобы...

27196 просмотров

python matplotlib plot mfcc

29.09.2021

Как получить MFCC со входа микрофона на android (C ++, Qt)

Я программирую приложение на Android и использую для этого Qt Creator. Ищу библиотеку, какие сэмплы сигнала, что-то вроде Aquila. Нужна технология MFCC. Буду признателен за все советы. Следующее - микрофон. Совершенно не знаю, как я получаю...

1172 просмотров

c++ android qt mfcc

11.11.2021

Альтернатива для ifstream (c ++) при попытке прочитать файл .wav в android

Я пытаюсь вычислить коэффициенты MFCC из файлов WAV, хранящихся на SD-карте. Я использую библиотеку: https://github.com/dspavankumar/compute-mfcc Входными данными является путь к файлу wav с использованием ifstream. Мне нужно иметь доступ к...

362 просмотров

c++ android java java-native-interface mfcc

29.09.2021

Обучите речь HMM от MFCC с помощью Matlab hmmtrain

Я прочитал много статей по этому поводу, но просто не понимаю, как мне действовать дальше. Я пытаюсь создать базовую систему распознавания речи, используя функции MFCC для HMM, я использую доступные данные здесь . Для этого я использую Matlab....

3648 просмотров

matlab speech-recognition signal-processing hidden-markov-models mfcc

14.04.2022

Следующие шаги, которые нужно сделать с mfccs, в веб-системе распознавания голоса

Я работаю над распознаванием голоса на урду (язык, на котором говорят в Пакистане, Индии и Бангладеш), чтобы перевести речь урду в слова урду. До сих пор я ничего не делал, а просто нашел библиотеку javascript meyda для извлечения mfccs из фреймов...

429 просмотров

javascript voice-recognition mfcc

21.05.2022

Как использовать MFCC в Weka для классификации аудио?

Я пытаюсь разработать метод классификации аудио с использованием MFCC в Weka. Имеющиеся у меня MFCC генерируются с размером буфера 1024, поэтому для каждой аудиозаписи есть серия коэффициентов MFCC. Я хочу преобразовать эти коэффициенты в формат...

1219 просмотров

machine-learning audio feature-extraction weka mfcc

01.06.2022

HMM — данные и формат тренировки

Я хочу реализовать HMM (скрытая модель Маркова), чтобы идентифицировать определенные слова. До сих пор мне удалось извлечь коэффициенты (MFCC) сигнала, и я задался вопросом, подходят ли эти данные для обучения HMM? Кроме того, подходит ли формат...

748 просмотров

speech-recognition signal-processing hidden-markov-models mfcc

14.06.2022

Набор фильтров Librosa MEL с убывающими треугольниками

Я немного застрял в понимании MFCC. Из того, что я прочитал, банки фильтров мел должны быть серией треугольников, которые становятся шире, а их пики находятся в одном и том же месте. Нравится... Однако, когда я вычисляю банки фильтров...

3793 просмотров

matplotlib librosa mfcc

16.06.2022

генерировать mfcc для аудио сегментов на основе аннотированного файла

Моя основная цель - передать функции mfcc в ИНС. Однако я застрял на этапе предварительной обработки данных, и мой вопрос состоит из двух частей. ИСТОРИЯ ВОПРОСА: У меня есть аудио. У меня есть текстовый файл с аннотацией и отметкой времени,...

648 просмотров

python audio librosa mfcc

24.06.2022

TypeError: объект 'module' не вызывается. МФЦК

Работаю над проектом, основанным на распознавании говорящего с использованием python, и получаю следующую ошибку при поиске MFCC . Traceback (most recent call last): File "neh1.py", line 10, in <module> complexSpectrum =...

8030 просмотров

python numpy speaker mfcc

13.07.2022

Работа с векторами MFCC разного размера в качестве обучающих данных

Я работаю над проектом, в котором я классифицирую кашель пациента как положительный или отрицательный при определенном легочном заболевании. На данный момент у меня есть несколько случаев кашля, сегментированные из более крупных записей. Я извлек...

845 просмотров

python machine-learning logistic-regression feature-selection mfcc

02.08.2022

Простой детектор слов с использованием MFCC

Я реализую программное обеспечение для распознавания речи с использованием коэффициентов Mel Frequency Cepstrum Coefficients. В частности, система должна распознавать одно указанное слово. Начиная с аудиофайла, я получаю MFCC в матрице с 12 строками...

1487 просмотров

machine-learning speech-recognition mfcc

09.08.2022

Как получить MFCC с TarsosDSP?

Я искал везде и не мог понять, как извлечь функцию MFCC с помощью TarsosDSP на Android. Я знаю, как получить БПФ из файла. Любая помощь?

2201 просмотров

android mfcc tarsosdsp

14.08.2022

Как изменить MFCC на PointList и GMM

Я делаю программу распознавания эмоций, используя пакет comirva. и у меня есть много wav-файлов об эмоциях, таких как злость, радость.. чтобы сделать gmm, сначала я извлек функции mfcc из одного из файлов argry. что я смутил, так это то, как...

838 просмотров

k-means speech-recognition gaussian point mfcc

14.01.2023

Создание банков фильтров MFCC аналогично примитивам производительности Intel

Я пытаюсь построить треугольные фильтры для генерации MFCC. У меня есть существующий код, основанный на IPP 6, но поскольку IPP 8 уже в разработке, я бы очень хотел получить реализацию, которая работает и не зависит от старой, теперь не...

508 просмотров

c++ mfcc intel-ipp

14.06.2023

Значение MFCC

У меня концептуальная проблема. Я знаю, что такое мел-шкала и что она представляет, и я знаю, что такого рода спектрограммы все еще содержат слишком много информации для того, что мне нужно. Я думаю, что если мы хотим уменьшить количество...

1553 просмотров

audio mfcc

15.05.2023

Применение K-средних к коэффициентам MFCC для ASR

Я разделил свой аудиосигнал на кадр 20 мс с перекрытием 10 мс. В итоге у меня 500 кадров. Я вычислил коэффициенты MFCC для каждого кадра. Я хочу выполнить векторное квантование для каждого кадра, используя алгоритм K-MEAN. У меня 16...

1404 просмотров

k-means speech-recognition speech mfcc

30.12.2022

HTK - Что представляют собой MFCC модели HMM и входной WAV-файл?

При создании MFCC следуя руководству Voxforge для системы преобразования речи в текст с использованием HTK (набор инструментов скрытой марковской модели) нам необходимо определить прототип модели для наших телефонов. Я пытаюсь обдумать этот файл....

572 просмотров

speech-to-text speech-recognition hidden-markov-models mfcc htk

08.05.2023

Почему логарифмическое правдоподобие странно при использовании MFCC и дельта-коэффициентов

Я работаю над проектом, который требует извлечения функций MFCC из аудиопотока. Проект состоит в основном из классификации, хотя в интересах расширения нашего набора данных я работаю над алгоритмом обнаружения, чтобы изолировать части звука, которые...

96 просмотров

machine-learning audio log-likelihood gmm mfcc

18.10.2022