формат звуковых данных

Каков фактический формат звуковых данных низкого уровня при чтении из потока в Java? Например, используйте следующую строку данных с частотой дискретизации 44,1 кГц, глубиной дискретизации 16 бит, 2 каналами, данными со знаком, форматом bigEndian.

TargetDataLine tdLine = new TargetDataLine (новый AudioFormat (44100,16,2, true, true));

Я понимаю, что это выборка 44100 раз в секунду, и каждая выборка составляет 16 бит. Я не понимаю, что представляют собой 16 бит или каждый из 16 бит. Кроме того, есть ли у каждого канала свой 16-битный сэмпл?

user1565671 31.07.2012 источник

comment

16 битов составляют число, которое представляет собой амплитуду звуковой волны во время этого дискретного отсчета, в конечном итоге измеряемую в значении от -1 до 1. Но почему имеет значение основной формат данных? - bzlm 31.07.2012

comment

Я хочу иметь возможность читать данные и выбирать экземпляры определенной частоты. - user1565671 31.07.2012

comment

Затем вам нужно изучить много больше, чем основы цифрового звука. :) Чтобы расширить ответ @ IronMensan, частоты, содержащиеся в части дискретизированного звука, являются длинами волн всех звуковые волны, которые диафрагма издает при движении. Это вычислимо, но сложно, и не является точной наукой. - bzlm 31.07.2012

Ответы (2)

arrow_upward
0
arrow_downward

Сначала я начну с вашего последнего вопроса, да, каждый канал имеет свою собственную 16-битную выборку для каждой из 44100 выборок каждую секунду.

Что касается вашего первого вопроса, вы должны знать об аппаратном обеспечении динамика. Есть диафрагма и электромагнит. Диафрагма - это большая круглая деталь, которую можно увидеть, сняв крышку. Когда электромагнит заряжается, он тянет или толкает железную пластину, прикрепленную к диафрагме, заставляя ее двигаться. Это движение становится звуком.

Ценность каждого сэмпла - это количество электричества, отправляемого динамику. Таким образом, когда образец равен нулю, диафрагма находится в состоянии покоя. Когда он положительный, он толкается в одну сторону, а когда отрицательный - в другую. Чем больше образец, тем больше перемещается диафрагма.

Если вы построите график всех образцов в ваших данных, у вас будет график движения динамика во времени.

IronMensan 31.07.2012

arrow_upward
0
arrow_downward

Вам следует узнать об основах цифрового аудио (Wiki дает вам начало и множество ссылок с дополнительными материалами для чтения ). После этого частота дискретизации 44,1 кГц, глубина дискретизации 16 бит, 2 канала, подписанные данные, формат bigEndian должны немедленно сообщить вам о низкоуровневом формате.

В данном случае это означает 44100 выборок / сек, 16-битные подписанные целые числа, представляющие каждую выборку, и, наконец, endianess определяет, в каком порядке байты 16-битного int помещаются в поток ( big endian = старший байт первым).

Durandal 31.07.2012

формат звуковых данных

Ответы (2)

Вопросы по теме