формат звуковых данных

Каков фактический формат звуковых данных низкого уровня при чтении из потока в Java? Например, используйте следующую строку данных с частотой дискретизации 44,1 кГц, глубиной дискретизации 16 бит, 2 каналами, данными со знаком, форматом bigEndian.

TargetDataLine tdLine = new TargetDataLine (новый AudioFormat (44100,16,2, true, true));

Я понимаю, что это выборка 44100 раз в секунду, и каждая выборка составляет 16 бит. Я не понимаю, что представляют собой 16 бит или каждый из 16 бит. Кроме того, есть ли у каждого канала свой 16-битный сэмпл?


person user1565671    schedule 31.07.2012    source источник
comment
16 битов составляют число, которое представляет собой амплитуду звуковой волны во время этого дискретного отсчета, в конечном итоге измеряемую в значении от -1 до 1. Но почему имеет значение основной формат данных?   -  person bzlm    schedule 31.07.2012
comment
Я хочу иметь возможность читать данные и выбирать экземпляры определенной частоты.   -  person user1565671    schedule 31.07.2012
comment
Затем вам нужно изучить много больше, чем основы цифрового звука. :) Чтобы расширить ответ @ IronMensan, частоты, содержащиеся в части дискретизированного звука, являются длинами волн всех звуковые волны, которые диафрагма издает при движении. Это вычислимо, но сложно, и не является точной наукой.   -  person bzlm    schedule 31.07.2012


Ответы (2)


Сначала я начну с вашего последнего вопроса, да, каждый канал имеет свою собственную 16-битную выборку для каждой из 44100 выборок каждую секунду.

Что касается вашего первого вопроса, вы должны знать об аппаратном обеспечении динамика. Есть диафрагма и электромагнит. Диафрагма - это большая круглая деталь, которую можно увидеть, сняв крышку. Когда электромагнит заряжается, он тянет или толкает железную пластину, прикрепленную к диафрагме, заставляя ее двигаться. Это движение становится звуком.

Ценность каждого сэмпла - это количество электричества, отправляемого динамику. Таким образом, когда образец равен нулю, диафрагма находится в состоянии покоя. Когда он положительный, он толкается в одну сторону, а когда отрицательный - в другую. Чем больше образец, тем больше перемещается диафрагма.

Если вы построите график всех образцов в ваших данных, у вас будет график движения динамика во времени.

person IronMensan    schedule 31.07.2012

Вам следует узнать об основах цифрового аудио (Wiki дает вам начало и множество ссылок с дополнительными материалами для чтения ). После этого частота дискретизации 44,1 кГц, глубина дискретизации 16 бит, 2 канала, подписанные данные, формат bigEndian должны немедленно сообщить вам о низкоуровневом формате.

В данном случае это означает 44100 выборок / сек, 16-битные подписанные целые числа, представляющие каждую выборку, и, наконец, endianess определяет, в каком порядке байты 16-битного int помещаются в поток ( big endian = старший байт первым).

person Durandal    schedule 31.07.2012