Публикации по теме 'data-visualization'


Компромисс смещения и дисперсии
Слова могут говорить сами за себя, но они могут сбивать с толку людей, плохо знакомых с машинным обучением и наукой о данных. В этом блоге я попытаюсь объяснить все, что вам нужно знать о компромиссе смещения и дисперсии. Давайте сначала начнем с определений, а затем углубимся в концепцию. Что такое предвзятость? В науке о данных предвзятость — это отклонение от ожидаемого в данных. В более общем плане предвзятость относится к ошибке в данных. Он говорит вам, насколько ваши прогнозы..

Исследование данных о наблюдениях НЛО
"Если мы самые разумные существа во вселенной... что ж, это просто угнетает". — Рекха Шарма В этом посте мы собираемся изучить Набор данных о наблюдениях НЛО Национального центра сообщений об НЛО. Вот некоторые из вопросов, на которые мы постараемся найти ответы: В каких районах страны наиболее вероятно появление НЛО? Имеют ли наблюдения общие описания в одних и тех же местах? Есть ли какие-либо тенденции в наблюдениях НЛО с течением времени? Набор данных Ознакомимся с..

Объяснение уменьшения размерности
Объяснение и реализация PCA на Python Содержание Вступление Что такое уменьшение размерности? Линейная комбинация Разработка функций и выбор функций Данные PCA - Интуиция - Математическая разбивка - Преимущества - Недостатки - Реализация Резюме Ресурсы Введение Уменьшение размерности - популярный метод машинного обучения, который обычно используется специалистами по обработке данных. В этой статье основное внимание будет уделено очень популярному подходу к..

Как реализовать модель линейной регрессии для задачи прогнозирования
Как реализовать модель линейной регрессии для задачи прогнозирования В этой статье мы погрузимся в модель линейной регрессии. В этом посте я расскажу, как загружать данные, строить модель, прогнозировать и оценивать модель линейной регрессии в python. Мы построим и оценим модель в наборе данных Boston Housing с помощью scikit-learn. Вы можете скачать набор данных здесь. Набор данных о жилищном строительстве Филадельфии: Набор данных взят из Филадельфии, штат Пенсильвания, и..

Лучшие рекомендуемые библиотеки и пакеты R для науки о данных в 2021 году
Язык программирования R играет важную роль в управлении проектами в области науки о данных. Каждому специалисту в области науки о данных необходимо постоянно обновлять библиотеки R, если он собирается работать с проектами, связанными со статистическими вычислениями. Если вас спросят о самых популярных языках программирования в науке о данных, вы услышите только Python, за которым следует R. Что ж, и R, и Python широко используются в науке о данных, хотя Python, похоже, набирает..

Как я могу подготовиться к большим компаниям в качестве специалиста по данным
Вот некоторые ведущие компании в Индии, которые нанимают специалистов по данным и платят эффективную заработную плату: Гиганты аналитики IBM  – предлагает 14 лаков в год. Deloitte  – предлагает 13 лаков в год. ZS Associates  — 10 лаков в год. Accenture  – 11 лаков в год ИТ-гиганты Amazon  – 15 лаков в год. Flipkart  – 16 лаков в год. Google  – 20 лаков в год Paytm - 12 лаков в год Минтра  – 13 лаков в год Во-первых, эти компании слишком подозрительны,..

4 самые полезные библиотеки Python для анализа данных, о которых должен знать каждый новичок.
Всем привет. Эта статья предназначена для тех, кто только начинает свой путь в области анализа данных и нуждается в кратком руководстве по наиболее важным используемым библиотекам. Давайте посмотрим на это таким образом, почему люди предпочитают автомобиль с автоматической коробкой передач, а не с механической коробкой передач? Это связано с тем, что автомобиль с автоматической коробкой передач обеспечивает нам простоту, поскольку на коробке передач есть опции «Движение», «Парковка»,..