Публикации по теме 'statistics'


4 самых фундаментальных, но игнорируемых предположения линейной регрессии
This is the second article in ML_Algorithms_A_to_Z Series: * Which focuses primarily on When? to use Linear Regression and it's 4 underlying assumptions . Link to previous article 📝:- You can refer to the previous article which covers Linear Regression and Gradient Descent basics. This series can be effectively used as a quick refresher for Data Science Interview preparations as we go from ground-up to Intermediate level concepts. The series of blogs aims🎯 at a fundamental..

Простота во всей красе: введение в наивный байесовский алгоритм
Если вы когда-либо работали с алгоритмами машинного обучения, вы, вероятно, сталкивались с наивным алгоритмом Байеса. Этот простой, но мощный классификатор широко используется в различных областях, включая обработку естественного языка, фильтрацию спама и медицинскую диагностику, и обладает рядом привлекательных функций, которые делают его хорошо подходящим для этих задач. По своей сути наивный алгоритм Байеса представляет собой вероятностный классификатор, который использует теорему..

Метрики прогнозирования: отзыв против точности с некоторыми антропоморфными (человеческими) интерпретациями.
Итак, я пытался понять некоторые показатели, используемые в науке о данных и статистике. И я попытался придумать способы понять концепции отзыва и точности. Я придумал несколько интересных способов их описания. Это грубый набросок, потому что это были только мои заметки, я, честно говоря, не забочусь о том, чтобы украсить его, и у меня нет времени. Тут ничего не происходит!: Вспомнить = Истинный прогнозируемый результат / Все положительные результаты = True Pos / TP + FN =..

Описательная и логическая статистика
Всякий раз, когда человеческий разум читает какие-то данные, он всегда анализирует распределение и пытается найти закономерности, чтобы понять данные, распределенные соответствующим образом. Отсюда следует статистика! Статистика - это часть науки, она объясняет сбор, анализ, интерпретацию и представление данных. В анализе данных есть две категории методов: Описательная статистика и Выводная статистика . Описательная статистика также известна как сводная статистика, которая..

Мой первый эксперимент с Azure ML Studo, часть 2: Моделирование
Azure ML Studio действительно хорош. Я смог провести с ним небольшой эксперимент и по-прежнему был организован в своей работе. Однако мне пришлось обратиться за помощью к Python для какой-то сложной задачи. В продолжение своего предыдущего поста я решил провести симуляцию для расчета прибыли розничного магазина на основе полученных от него исходных статистических данных. Это просто случайный эксперимент, чтобы доказать, насколько близки симуляции и распределения данных (рассчитанные с..

Визуализация теории информации о функциях (часть 2)
Лора: Этот пост посвящен визуализации непрерывных и дискретных функций с помощью теории информации. Предположительно оно появилось перед Частью 1 , но для чтения идет как Часть 2. В пост не вносилось никаких изменений, изначально на Kaggle . ололо написал: Я использовал более 5000 различных лесов условного вывода, чтобы определить потенциально лучшие сегменты для каждой переменной Мне тоже интересно, как ты это сделал? Есть ли для этого пакет R/python? Могут ли ведра быть..

Введение в вероятность и статистику для специалистов по данным и машинное обучение с использованием Python …
Введение в вероятность и статистику. Давайте поймем необходимость вероятности на примере. Это карта Индии, которая показывает региональную классификацию, основанную на языке, на котором говорят люди. Теперь область, выделенная желтым цветом, показывает количество людей, говорящих на бихари, а в оранжевой области (центральная зона) люди говорят на хинди. Сейчас главное беспокойство людей, живущих недалеко от границы Бихари и центральной зоны, на каком языке они говорят. Хотя на..