Итоги дней 091 и 092

За последние два дня мы говорили о частоте дискретизации и о том, как определить подходящую частоту дискретизации для цифрового представления звука, и это было связано с осью x, временной осью нашего представления формы волны.

Вы можете наверстать упущенное по ссылкам ниже





100 Days Of ML Code — День 091
Выводы из дня 090medium.com



Начиная с сегодняшнего дня, мы обратимся к оси Y, оси амплитуд и поговорим о том, сколько двоичных цифр. Какова должна быть наша битовая ширина для представления каждой выборки амплитуды, которую мы записываем. Мы более формально поговорим о том, что такое разрядность, и рассмотрим, что такое двоичные числа, если вы еще с ними не знакомы. А затем мы также поговорим о некоторых значениях битовой ширины с точки зрения того, как мы записываем звук, а также о том, как художники использовали ее в некоторых интересных целях.

Разрядность

Формально разрядность — это количество двоичных разрядов, которые мы используем для представления амплитуды каждой выборки.

Итак, для каждой точки на изображении, показанном выше, сколько двоичных чисел мы используем на компьютере? Сколько нулей или единиц мы используем для представления того, что это за значение амплитуды? Поэтому важно, чтобы мы думали об этом с точки зрения двоичных чисел.

Итак, если бы у нас была битовая ширина, равная, например, единице, это означало бы, что мы будем использовать одну двоичную цифру, а двоичная цифра может быть либо нулем, либо единицей. Он либо включен, либо выключен. Итак, у нас есть две возможности: либо ноль, либо единица. Таким образом, это означает, что наше разрешение фактически равно двум, у нас есть два варианта того, как мы собираемся представлять амплитуду, и это, очевидно, будет невероятно ограничивающей средой для работы.

Итак, если нам нужны два бита, каждый из них, каждая из двух двоичных цифр, как показано в таблице выше, может быть либо нулем, либо единицей. Итак, две возможности для первой цифры, две возможности для второй цифры. 2 раза 2 равно 4. Все еще довольно ограничено. И когда до 8 бит, что на самом деле используется в некоторых записях с довольно низким разрешением. У меня есть 8 двоичных цифр, 2 возможности в 8-й степени, 256 возможных значений амплитуды. Другими словами, поскольку мы переводим отрицательное значение в положительное пространство амплитуды, эту ось Y над формой сигнала, мы как бы ограничили его до 256 различных возможностей, равномерно распределенных по этому пространству.

16 бит, которые мы используем на компакт-дисках, у нас есть возможности от 2 до 16 около 65 000, а затем 24 бита, которые я люблю использовать, когда это возможно, у нас есть возможности от двух до 24 до 16 миллионов. Кроме того, эти дополнительные восемь битов от 16 до 24 бит дают вам много дополнительного разрешения по оси Y от 65 000 до примерно 16 000 000. Некоторые люди также записывали 32-битную музыку с помощью высококачественного программного и аппаратного обеспечения для обработки звука.

Так что, очевидно, мы хотим записывать с максимально возможным разрешением, в пределах ограничений любого носителя, с которым мы работаем. Очевидно, в конце концов вы знаете, что при использовании компакт-диска мы будем ограничены 16 битами, когда мы, наконец, закодируем этот файл для компакт-диска. Но мы не можем использовать бесконечное количество дискового пространства, к этой проблеме мы вернемся позже в будущем, но я также просто хочу поговорить о последствиях этого для записи, потому что недостаточно просто записать что-то с хорошей разрядностью. используя 16 бит или 24 бита или 32 бита или что-то еще.

Очень важно, чтобы при записи вы пытались использовать полный динамический диапазон, доступный вам, потому что, если вы записываете с высокой разрядностью, но используете только крошечный бит отрицательного, положительного диапазона амплитуды, потому что вы можете крутить очень низко или что-то еще, может происходить в вашем процессе, вы тратите все эти биты впустую, они просто никогда ни для чего не используются, и поэтому вы фактически записываете с гораздо более низким разрешением.

Но, с другой стороны, если вы записываете слишком громко, я бы не стал использовать каждый из этих битов, несмотря ни на что. Это также проблема, потому что, если вы перейдете к отрицательным, положительный диапазон хорошо, то у вас закончатся двоичные цифры для представления этих значений амплитуд, и поэтому все они просто как клипы обрезаются на положительном или отрицательном. один, так что в итоге вы получите что-то, называемое цифровым искажением, что тоже нехорошо. По сути, пики и впадины всех ваших волновых форм просто обрезаются, и это тоже звучит не очень хорошо.

Это все, что касается дня 093. Надеюсь, вы нашли это информативным. Спасибо, что нашли время в своем графике и позволили мне быть вашим проводником в этом путешествии. И до следующего раза, будь легендой.