Модуль 17 — Равномерное распределение

В этом пошаговом руководстве мы познакомим вас с основной концепцией равномерного распределения с помощью Python. Давайте окунемся!

Шаг 1 — Введение в равномерное распределение

Концепция равномерного распределения адаптирована для непрерывных данных. Он вращается вокруг единственного значения, которое обозначается как 1/(b-a) и имеет значение в определенном диапазоне [a, b]. Если мы выйдем за пределы этого диапазона, все значения будут равны нулю. Это распределение можно сравнить с категориальной переменной с двумя возможными категориями: 0 или заданное значение. Интересно, что эта категориальная переменная может принимать несколько значений в непрерывном диапазоне, определяемом числами a и b.

Математическое представление:

Шаг 2 — Нормализация частоты с помощью плотности

Используя опцию плотности, мы можем нормализовать частоту возникновения каждого результата. Вместо того, чтобы сосредоточиться исключительно на частоте, этот параметр дает нам относительную частоту возникновения.

Шаг 3 — Управление группами данных

Опция интервалов играет решающую роль в определении количества групп данных в распределении. Этот параметр позволяет нам контролировать степень детализации представления данных.

Шаг 4 — Первоначальная визуализация распределения

Первое выходное изображение, созданное на основе данных, демонстрирует начальное приближение идеального равномерного распределения. Из-за ограниченного размера выборки случайной величины мы берем только 100 выборок, приближение может быть не идеальным. В результате некоторые интервалы или группы демонстрируют относительную частоту, превышающую 1, тогда как другие отображают относительную частоту ниже 1.

Теперь мы берем 1000 образцов, и наша плотность такая же, как и в данном случае, равная 1, и мы не можем изменять какой-либо параметр, давайте посмотрим, каков будет результат на выходе.

Шаг 6 — Расширенная аппроксимация с увеличенным размером выборки

Одно примечательное наблюдение заключается в том, что точность приближения к идеальному равномерному распределению улучшается по мере увеличения размера выборки случайной величины. В конечном выходном изображении, в котором используется значительный размер выборки в 100 000 выборок случайных величин, представление заметно ближе к идеальному равномерному распределению.

Заключение

По сути, равномерное распределение предлагает уникальный взгляд на данные с непрерывными значениями, характеризующиеся различным значением в заранее определенном диапазоне. С помощью опций плотности и интервалов мы получаем контроль над нормализацией частоты и группировкой данных соответственно. Поведение и точность распределения ярко иллюстрируются визуальными результатами, подчеркивая важность размера выборки для достижения точного представления идеального равномерного распределения.