Публикации по теме 'data-preprocessing'


Машинное обучение: линейная регрессия в Python
В моей первой статье я объясню, как реализовать простую модель линейной регрессии в Python. Прежде чем мы начнем, я хотел бы сначала рассказать вам о теории, а затем продемонстрировать, как она работает. Теория линейной регрессии Простая линейная регрессия — это тип алгоритмов регрессии, который моделирует взаимосвязь между зависимой переменной (обычно y) и одной независимой переменной ( x) . Отношение, показанное моделью простой линейной регрессии, представляет собой линейную..

Делайте прогнозы за 5 минут
Sklearn, Statsmodels, Tensorflow… Нейронные сети, регрессии — все сразу и очень просто… Существует множество сложных алгоритмов, библиотек и идей для прогнозирования, но нужно время, чтобы опробовать их все и сравнить. Для этого у нас есть predictit . Сейчас можно просто найти подходящий метод, импортировать его и готово. Но в дни изобилия, даже если нам не нужно разрабатывать собственные модели, требуется много времени, чтобы сравнить все возможные решения. У нас есть много..

Три критических элемента предварительной обработки данных — Часть 3
Основа моделирования в науке о данных. В этой статье я расскажу о преобразовании данных, важнейшем элементе этапа предварительной обработки данных в жизненном цикле проекта по науке о данных. Предварительная обработка данных — это процесс преобразования необработанных данных из разных источников в уточненную форму, которую можно использовать для получения полезных сведений. Это влечет за собой интеграцию, очистку и трансформацию. В первой части этой серии мы обсудили..

Машинное обучение — Пошаговый шаблон этапа предварительной обработки данных
Предварительная обработка данных — важный этап построения модели машинного обучения. Это не захватывающий этап, но иногда он занимает много времени. Поэтому очень важно иметь готовый шаблон или руководство, включающее в себя набор шагов, которые вы должны выполнить, чтобы ускорить предварительную обработку. Это первый важный шаг, потому что каждый раз, когда вы хотите написать модель машинного обучения, у вас есть этап предварительной обработки данных, над которым нужно работать. Вы..

«Раскрытие потенциала: глубокое погружение в повышение производительности машинного обучения»
По мере того, как мы отправляемся в захватывающий мир машинного обучения, в центре внимания оказывается захватывающее искусство прогнозного моделирования. Представьте себе волнение, связанное с созданием моделей, которые извлекают уроки из прошлого и позволяют предсказывать будущее с поразительной точностью. Если вы чем-то похожи на меня, вы, несомненно, задумывались: «Каковы секреты того, как вывести эти предсказания на новый уровень?» Присоединяйтесь ко мне, и мы погрузимся в..

Выбор функций с практическим подходом
Наука о данных , Машинное обучение Выбор функций с практическим подходом Изучите методы выбора объектов, которые используются для наиболее практичного выбора важных объектов из набора данных. В этой статье мы выполним выбор функций по наборам данных с помощью различных методов, доступных в наиболее практичном подходе. Выбор функций - один из важнейших этапов жизненного цикла любого проекта в области науки о данных. Есть много статей, в которых теоретически описаны методы,..

Как использовать двоичное кодирование для обработки категориальных переменных в машинном обучении
В машинном обучении категориальные переменные — это те, которые принимают ограниченное количество дискретных значений, таких как цвет, пол или страна происхождения. Чтобы использовать категориальные переменные в модели машинного обучения, их необходимо закодировать в числовые значения, которые может обрабатывать модель. Одним из распространенных методов кодирования категориальных переменных является двоичное кодирование, при котором для каждой категории в переменной создаются двоичные..