Супер простое (но технически правильное) объяснение доверительного интервала вместе с коротким примером.

Определение

Доверительный интервал количества – это диапазон значений, содержащий истинное значение этого количества с некоторым уровнем достоверности.

  • Доверительный интервал всегда имеет связанный уровень достоверности. Грубо говоря, уровень достоверности — это просто вероятность содержания истинного значения.
  • Точнее, если бесконечное количество независимых выборок некоторой совокупности используется для построения доверительных интервалов величины с некоторым уровнем достоверности, доля интервалов, которые будут содержать истинное значение совокупности количества будет равно доверительному уровню.

Пример

Допустим, у вас есть группа из 1000 человек с нормальным распределением роста со средним значением μ и стандартным отклонением σ. Скажем, вы хотите угадать рост человека в этой группе с достоверностью 68%.

Для нормального распределения 68% точек данных находятся в пределах одного σ от μ. Следовательно, 68-процентный доверительный интервал для роста человека из группы будет равен μ ± σ.

Что, если бы мы захотели построить доверительный интервал (неопределенность) вокруг самой средней высоты? Для этого мы должны рассмотреть распределение среднего. Выборочное среднее (среднее) нормального распределения также нормально распределено со средним значением μ и стандартным отклонением σ/√n. Таким образом, 68-процентный доверительный интервал для среднего роста группы будет равен μ ± σ/√n.

Дополнительная информация: Потрясающее видео Академии Хана о доверительных интервалах