Лучшее руководство, чтобы узнать, как извлечь из нее максимум удовольствия!
Эта статья призвана проиллюстрировать этапы цикла проекта по науке о данных аналогией с историей о мальчике, который пытается завязать серьезные отношения с дамой.
Итак, давайте узнаем, как он хочет это сделать ...
Во-первых, позвольте мне познакомить вас с актерами рассказа:
- Ким: специалист по данным
- Лина: Данные
Найдите свою дату
Этот шаг может показаться очевидным, однако это не так!
В реальных случаях извлечение достаточного количества информации, например данных, может либо привести вас в правильном, либо в неправильном направлении.
Чем выше качество данных, тем меньше у нас будет неопределенности, и наоборот.
Поэтому важно использовать правильный тип данных и помнить о том, что сбор данных может быть сложной задачей и потребовать много времени.
Планируйте дату
- Что вы собираетесь делать со своими данными?
- Установите цель, которую нужно достичь в конце обучения, чтобы избежать путаницы, вводящей в заблуждение (обратите внимание, что это часто случается).
Узнай свою дату
- Сделайте некоторые визуализации и сводную статистику.
- Поймите, о чем ваши данные. Хорошо знайте каждую функцию и спрашивайте ее качества.
- Примените технику EDA (исследовательский анализ данных).
Ищите что-нибудь странное
Под странным мы подразумеваем данные с необычной ценностью, которые могут быть хорошими или плохими.
Некоторые выбросы могут помочь вам лучше понять ваши данные, в то время как другие можно игнорировать ... Если таковые имеются, исследуйте, почему значения отсутствуют в ваших данных, и, если возможно, найдите лучший способ вменения.
Возьми свое свидание
- Попробуйте различные модели машинного обучения и тренируйте их на своих данных.
- Каждая модель предназначена для определенных типов данных. Найдите одну и оптимизируйте ее.
Оцените свое свидание
- Определите свои показатели и посмотрите, стоило ли все ваше обучение того.
- Соответствует ли это вашим ожиданиям? В противном случае вы собираетесь больше тренироваться или собирать больше данных.
Заключение :
Это были ключевые шаги, которым должен следовать каждый специалист по данным, чтобы обеспечить надежную интерпретацию данных и содержательные результаты.
Если у вас есть какие-либо вопросы или комментарии, не стесняйтесь оставлять свои отзывы ниже или вы всегда можете связаться со мной через LinkedIn.
Спасибо за чтение и удачного свидания .. AKA Data;)