Я пытаюсь разработать приложение, способное распознавать звуковой фрагмент с изображением животного. Что я делаю, так это то, что я беру запись AMR и читаю из него массив байтов, отправляю эти данные через БПФ и соответствующим образом вычисляю амплитуды.
Частота дискретизации файла AMR 8 кГц (стандартный AMR 15 секунд)
Количество точек БПФ 4096 для ввода 8192 значений
Затем я вычисляю амплитуду по амплитуде = 2 * значение точки БПФ / 8192
Итак, сейчас я намерен получить всплеск на частоте, относящейся к самой высокой амплитуде. Проблема в том, что всплеск на самой высокой амплитуде не является постоянным для какого-то другого звукового клипа того же животного. Для другого звукового клипа изменяется частота, относящаяся к максимальной амплитуде. Для этого есть причина?. Любая помощь и руководство по этому поводу будут оценены. Заранее спасибо.