Работа с векторами MFCC разного размера в качестве обучающих данных

Я работаю над проектом, в котором я классифицирую кашель пациента как положительный или отрицательный при определенном легочном заболевании.

На данный момент у меня есть несколько случаев кашля, сегментированные из более крупных записей. Я извлек различные спектральные признаки для каждого случая кашля и хочу добавить их все в один вектор признаков для обучения классификатора логистической регрессии (LR).

Проблема в том, что каждое событие кашля имеет разную длину, и это приводит к тому, что мои функции MFCC также различаются по длине, что является проблемой при обучении классификатора LR.

Итак, я хочу знать, есть ли у кого-нибудь какое-либо исправление для работы с векторами признаков MFCC разных размеров и как привести их в правильную форму для использования в качестве обучающего вектора. Я чувствую себя очень глупо, но я не могу найти ничего об этом в Интернете. Наверняка с этой проблемой уже сталкивались?


person Renier Botha    schedule 17.02.2016    source источник
comment
Можете ли вы уточнить, что вы используете для ввода линейной регрессии? Этот метод обычно работает с фиксированным количеством объектов, так что все входные данные имеют одинаковый размер. Мне кажется, что вы пытаетесь передать ему временной ряд данных, а не набор извлеченных функций. Как вы обнаружите, последовательности MFCC не очень хорошо подходят для ввода LR.   -  person Prune    schedule 17.02.2016
comment
@Arton Dorneles, с вводом логистической регрессии. Я имею в виду матрицу входных признаков, предоставленную алгоритму для обучения. Спасибо, да, теперь я это понимаю. Чтобы получить входную матрицу в правильной форме, я решил усреднить по всем окнам в каждом событии кашля для 13 MFCC, которые я извлекаю. Но чтобы сохранить некоторое представление о временных рядах, я разделю каждую запись на 3/4 (все еще определяющие) части. Таким образом, каждая запись кашля будет иметь 3 (или 4) x 13 коэффициентов MFCC. Предвидите ли вы какие-либо проблемы с этим методом?   -  person Renier Botha    schedule 17.02.2016
comment
RenierBotha, возможно, вы хотели упомянуть @Prune вместо меня, верно? К сожалению, я не могу вам помочь, так как ничего не знаю о MFCC.   -  person Arton Dorneles    schedule 18.02.2016
comment
Вы искали подходящие решения? Я новичок в MFCC (давно проходил стажировку в FFT), но быстро нашел это и это, что иметь дело с начальной потерей информации и обработкой клипов разной длины. Если вы не найдете здесь подходящих ссылок, пожалуйста, проиллюстрируйте ваши предложения, и я смогу попробовать решить проблему.   -  person Prune    schedule 18.02.2016
comment
Для тех, кто еще пытается понять это, здесь это хорошее введение в MFCC.   -  person Prune    schedule 18.02.2016