Я использую следующий код для получения спектрограммы Мела из записанного аудиосигнала длительностью около 30 с:
spectrogram = librosa.feature.melspectrogram(y=self.RawSamples,sr=self.SamplingFrequency, n_mels=128, fmax=8000)
if show:
plt.figure(figsize=(10, 4))
librosa.display.specshow(librosa.power_to_db(self.Spectrogram, ref=np.max), y_axis='mel', fmax=8000, x_axis='time')
plt.colorbar(format='%+2.0f dB')
plt.title('Mel spectrogram')
plt.tight_layout()
Полученная спектрограмма: спектрограмма Мела
Не могли бы вы объяснить мне, почему на временной оси отображается удвоенная продолжительность времени (она должна быть 30 с). Что не так с кодом?
librosa.core.to_mono
? - person Paul R   schedule 12.07.2018