Публикации по теме 'statistics'


Утрата умозаключений
Растущая область науки о данных / машинного обучения в значительной степени заимствует статистику, но убивает ее. Например, «фиктивная переменная» становится «горячим кодированием», «независимые переменные» становятся «функциями». Этот сдвиг в номенклатуре приводит к потере методологического смысла, присущего исходным названиям; например, при обычном поиске в Google по набору данных «auto-mpg» будет выведено множество страниц с инструкциями, почти все из которых рассматривают..

Объяснение анализа основных компонентов (PCA)
Многомерные данные — это наборы данных, в которых каждое наблюдение или точка данных имеют большое количество признаков или переменных. Изображения — это простейший пример многомерных данных, где каждый пиксель служит измерением. Изображения с высоким разрешением могут иметь миллионы пикселей, что приводит к огромному количеству измерений. Анализ основных компонентов, или сокращенно PCA, — это метод уменьшения размерности , используемый для сжатия многомерных данных при сохранении..

Проверка гипотез, часть 2
P-значение P-значение – это вероятность получения выборки как или более экстремальной (имеющей больше доказательств против H₀ ), чем наша собственная выборка, с учетом нулевой гипотезы. ( H₀ ) верно. Допустим, я провожу эксперимент, в котором я посылаю кого-то (взяв опекуна из Doom 2) украсть горох. Это испытание Бернулли, поскольку результаты эксперимента либо крадут горох, либо нет (результат типа «да/нет»). Это испытание становится биномиальным распределением, то есть..

Вероятность и статистика : основа машинного обучения
Машинное обучение — это междисциплинарная область, которая использует статистику, вероятность, алгоритмы для изучения данных и предоставления информации, которая может быть использована для создания интеллектуальных приложений. Совместное распределение вероятностей Вероятность событий A и B, обозначенная P(A and B) or P(A ∩ B) , представляет собой вероятность того, что события A и B произойдут одновременно. P(A ∩ B) = P(A). P(B) . Это применимо только в том случае, если A..

Какова связь между распределением Гаусса и CLT?
Распределение Гаусса — это распределение вероятностей, которое является симметричным и имеет форму колокола. Он параметризуется средним значением и стандартным отклонением и обычно используется для моделирования случайных величин, возникающих в природных явлениях, таких как рост людей, вес объектов и многие другие…

Основы статистики 1: среднее, медиана и мода (с кодом Python)
Основы статистики 1: среднее, медиана и мода (с кодом Python) Что такое данные? Это набор фактов, таких как числа, слова, результаты экспериментов, иногда описания вещей, миллионы изображений/видео в Интернете, тысячи книг и т. д. Данные повсюду вокруг нас, и их нужно изучать, анализировать и принимать решения с помощью эти данные нам нужна статистика. Что такое статистика? Это раздел прикладной математики, который занимается сбором и анализом больших числовых наборов данных,..

Глубокое обучение - это неравновесная информационная динамика
По сути, существует несколько лагерей, изучающих нейроподобные системы. Есть люди, которые настаивают на биологическом подходе. К ним относятся такие фирмы, как Numenta, Vicarious и исследователи в области Коннектома. Другой лагерь состоит из людей байесовской религии. Люди, которые верят, что некая теорема, изобретенная в 18 веке, станет ключом к нашему пониманию интеллекта. Есть также алхимики, которых на самом деле не волнует теория, и которые более чем счастливы представить..