Статьи по теме data-science

Публикации по теме 'data-science'

Как не быть обманутым точностью модели

Визуальное руководство по метрикам модели бинарной классификации и их правильному использованию Фон — простой на поверхности Метрики, используемые для оценки эффективности моделей классификации, довольно просты, по крайней мере, с математической точки зрения. Тем не менее, я заметил, что многие специалисты по моделированию и специалисты по данным сталкиваются с трудностями при формулировании этих показателей и даже применяют их неправильно. Это легко допустить ошибку, поскольку эти..

Что такое начальная загрузка в машинном обучении?

Большая часть статистики связана со сравнением двух вещей и определением того, различаются ли они на самом деле, или же мы случайно наблюдали разницу в собранной нами выборке, но на самом деле разницы нет. Вот что делает статистику такой интересной. Например, действительно ли производительность iphone13 лучше, чем у iphone10? Или модель машинного обучения, которую я построил, действительно лучше существующей системы? Для примера с iphone, как бы вы это сделали? Предположим, вы измеряете..

Разработка приложения для прогнозирования оттока клиентов: мой путь в науке о данных

Введение: Как специалист по данным, я приступил к интересному проекту, направленному на решение проблемы оттока клиентов в телекоммуникационной отрасли. В этой статье я познакомлю вас с процессом разработки приложения для прогнозирования оттока клиентов, целью которого является улучшение качества обслуживания клиентов и снижение оттока. Присоединяйтесь ко мне, и я расскажу о своем путешествии, от исследования данных и разработки моделей до развертывания приложений. Развертывание..

Уменьшение размеров с помощью PCA для всех

Краткое введение Цель-: Цель этой статьи — объяснить уменьшение размеров как полезный метод предварительной обработки перед подгонкой к модели и показать рабочий процесс в Python. Случай использования – Иногда при построении прогностической модели вы можете столкнуться с наборами данных с большим количеством столбцов/функций, также известных как измерения. Выяснение того, какие столбцы обладают наибольшей прогностической силой, в этих обстоятельствах может быть затруднено. Вот где..

API ChatGPT теперь открыт: снижение затрат на 90 %

Создание бота ChatGPT с помощью OpenAI gpt-3.5-turbo и Python OpenAI, компания, стоящая за популярным сервисом чат-ботов ChatGPT, объявила 1 марта 2023 года, что модель ИИ, управляющая чат-ботом, будет доступна для общественности по цене в десять раз ниже, чем их самая сильная существующая модель text-davinci-003.

Топ-4 фрилансера проекта Data Science

как мы все знаем, «наука о данных» — это красивая работа с 2021 года. Количество пользователей на различных платформах, таких как платформы социальных сетей и платформы электронной коммерции, увеличивается с каждым днем, поэтому управление данными стало очень важным. С другой стороны, наука о данных помогает нам организовывать, классифицировать и поддерживать данные. Вот самые популярные продавцы-фрилансеры, которые предоставляют свои удивительные услуги и сокращают временные затраты...

Предиктивный анализ против машинного обучения | Системы ХДата

Предиктивная аналитика может предсказывать поведение населения, анализируя закономерности, которые оно генерирует с течением времени. Машинное обучение — это тип предиктивной аналитики, который использует алгоритмы для изучения данных и создания прогнозов на основе того, что известно о подобных ситуациях в прошлом. Оба эти метода представляют собой способы использования больших объемов данных, в чем и заключается сходство, но они используются для разных целей и могут выполнять несколько..