Публикации по теме 'data-cleaning'
Что нужно сделать перед применением любой модели машинного обучения
Информация — это «масло 21 века , а аналитика — двигатель внутреннего сгорания». — Питер Зондергаард , старший вице-президент Gartner Research.
По моему мнению, у каждого Data Scientist есть свой набор методов работы с данными. У меня также есть свой способ работы с данными, и я хотел бы поделиться с вами шагами. Я буду использовать Python для демонстрации примеров.
Действия, которые необходимо выполнить перед применением любой модели к данным:
Внимательно прочитайте..
Очистка данных: изучение не только графиков
Изучение скрытой информации в наборе данных Online Retail.
В мире науки о данных очистка данных и EDA являются основными компонентами, которые рассматриваются во всех обсуждениях и книгах, но часто мы сокращаемся, либо отбрасываем неуклюжие данные и двигаемся вперед, либо не делаем особой проверки данных. Я пишу эту статью, потому что обнаружил, что этот конкретный набор данных обрабатывается во многих местах, но для понимания данных не уделяется должной осмотрительности. В Данные..
Один из камней бесконечности «Feature Engineering»
При создании проекта по науке о данных мы все следуем жизненному циклу науки о данных, который состоит из различных этапов, включая:
· Сбор данных
· Особенности разработки
· Выбор характеристик
· Создание модели
· Тюнинг модели
· Оценочные матрицы
· Развертывание
Чтобы назвать наш проект проектом по науке о данных, мы должны включить все вышеперечисленные этапы. Но здесь мы собираемся обсудить важную и трудоемкую фазу — разработку функций.
По моему опыту, разработка..
Взлом конвейера обработки данных!
Серия Feature Engineering
Взлом конвейера обработки данных!
Понимание данных - Take # 01
У нас есть современные передовые алгоритмы для создания совершенно захватывающих визуализаций, выявления моделей покупок потребителей на миллиарды долларов и анализа потоков доходов с использованием больших данных в сочетании с потрясающими масштабируемые механизмы аналитики. Но, будучи специалистом по анализу данных, все сводится к единой точке входа, особенно при входе в отрасль - «Где..