Публикации по теме 'data-cleaning'


Что нужно сделать перед применением любой модели машинного обучения
Информация — это «масло 21 века , а аналитика — двигатель внутреннего сгорания». — Питер Зондергаард , старший вице-президент Gartner Research. По моему мнению, у каждого Data Scientist есть свой набор методов работы с данными. У меня также есть свой способ работы с данными, и я хотел бы поделиться с вами шагами. Я буду использовать Python для демонстрации примеров. Действия, которые необходимо выполнить перед применением любой модели к данным: Внимательно прочитайте..

Очистка данных: изучение не только графиков
Изучение скрытой информации в наборе данных Online Retail. В мире науки о данных очистка данных и EDA являются основными компонентами, которые рассматриваются во всех обсуждениях и книгах, но часто мы сокращаемся, либо отбрасываем неуклюжие данные и двигаемся вперед, либо не делаем особой проверки данных. Я пишу эту статью, потому что обнаружил, что этот конкретный набор данных обрабатывается во многих местах, но для понимания данных не уделяется должной осмотрительности. В Данные..

Один из камней бесконечности «Feature Engineering»
При создании проекта по науке о данных мы все следуем жизненному циклу науки о данных, который состоит из различных этапов, включая: · Сбор данных · Особенности разработки · Выбор характеристик · Создание модели · Тюнинг модели · Оценочные матрицы · Развертывание Чтобы назвать наш проект проектом по науке о данных, мы должны включить все вышеперечисленные этапы. Но здесь мы собираемся обсудить важную и трудоемкую фазу — разработку функций. По моему опыту, разработка..

Взлом конвейера обработки данных!
Серия Feature Engineering Взлом конвейера обработки данных! Понимание данных - Take # 01 У нас есть современные передовые алгоритмы для создания совершенно захватывающих визуализаций, выявления моделей покупок потребителей на миллиарды долларов и анализа потоков доходов с использованием больших данных в сочетании с потрясающими масштабируемые механизмы аналитики. Но, будучи специалистом по анализу данных, все сводится к единой точке входа, особенно при входе в отрасль - «Где..