Почему важно их понимать?

Наука о данных зависит от пула данных в реальном мире. Как специалист по данным, вы должны собрать как можно больше данных. Вам нужно проанализировать их, используя инструменты визуализации. Но как можно классифицировать данные как тот или иной набор? Всегда есть шанс, что данные окажутся в другом наборе. Вот где появляется вероятность. Здесь мы обсудим основы вероятности.

По сути, вероятность можно описать как уверенность в том, что событие произойдет. Например, вероятность того, что монета выпадет орлом, равна 1/2 .

Как рассчитать вероятность и какие термины с ней связаны? Вы можете начать со сбора данных, данные, состоящие из каждого члена в группе, называются населением.Нам практически невозможно собрать данные от каждого члена. Поэтому мы случайным образом собираем как можно больше данных, и этот набор данных называется выборка. Численное описание выхода населения называется случайной величиной. Случайные величины могут быть непрерывными, т. е. иметь дискретные действительные значения (ограниченное наблюдение). Результаты выборки называются событием. Среднее значение событий в популяции (μ) или выборке (x̄) называется средним.

Давайте рассмотрим пример игры в кости, чтобы понять, как рассчитать вероятность.

X= {1, 2, 3, 4, 5, 6} # X= random variable describes all outcomes of        #rolling a die
P(X=1) =1/6 #since 1 occurs once in the random variable 
P(X is odd) = 1/2 #since {1,3,5} are odd --> 3/6 --> 1/2

Вероятность можно рассчитать как количество раз, когда событие происходит, и общее количество результатов в выборке.

Тем самым мы выполнили абсолютный минимум вероятности. Мы можем изучить их распределение и теоремы в будущем.

Больше контента на plainenglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Получите эксклюзивный доступ к возможностям написания и советам в нашем сообществе Discord.