В этом пошаговом руководстве мы познакомим вас с основной концепцией равномерного распределения с помощью Python. Давайте окунемся!
Шаг 1 — Введение в равномерное распределение
Концепция равномерного распределения адаптирована для непрерывных данных. Он вращается вокруг единственного значения, которое обозначается как 1/(b-a) и имеет значение в определенном диапазоне [a, b]. Если мы выйдем за пределы этого диапазона, все значения будут равны нулю. Это распределение можно сравнить с категориальной переменной с двумя возможными категориями: 0 или заданное значение. Интересно, что эта категориальная переменная может принимать несколько значений в непрерывном диапазоне, определяемом числами a и b.
Математическое представление:
Шаг 2 — Нормализация частоты с помощью плотности
Используя опцию плотности, мы можем нормализовать частоту возникновения каждого результата. Вместо того, чтобы сосредоточиться исключительно на частоте, этот параметр дает нам относительную частоту возникновения.
Шаг 3 — Управление группами данных
Опция интервалов играет решающую роль в определении количества групп данных в распределении. Этот параметр позволяет нам контролировать степень детализации представления данных.
Шаг 4 — Первоначальная визуализация распределения
Первое выходное изображение, созданное на основе данных, демонстрирует начальное приближение идеального равномерного распределения. Из-за ограниченного размера выборки случайной величины мы берем только 100 выборок, приближение может быть не идеальным. В результате некоторые интервалы или группы демонстрируют относительную частоту, превышающую 1, тогда как другие отображают относительную частоту ниже 1.
Теперь мы берем 1000 образцов, и наша плотность такая же, как и в данном случае, равная 1, и мы не можем изменять какой-либо параметр, давайте посмотрим, каков будет результат на выходе.
Шаг 6 — Расширенная аппроксимация с увеличенным размером выборки
Одно примечательное наблюдение заключается в том, что точность приближения к идеальному равномерному распределению улучшается по мере увеличения размера выборки случайной величины. В конечном выходном изображении, в котором используется значительный размер выборки в 100 000 выборок случайных величин, представление заметно ближе к идеальному равномерному распределению.
Заключение
По сути, равномерное распределение предлагает уникальный взгляд на данные с непрерывными значениями, характеризующиеся различным значением в заранее определенном диапазоне. С помощью опций плотности и интервалов мы получаем контроль над нормализацией частоты и группировкой данных соответственно. Поведение и точность распределения ярко иллюстрируются визуальными результатами, подчеркивая важность размера выборки для достижения точного представления идеального равномерного распределения.