Лучшее руководство, чтобы узнать, как извлечь из нее максимум удовольствия!

Эта статья призвана проиллюстрировать этапы цикла проекта по науке о данных аналогией с историей о мальчике, который пытается завязать серьезные отношения с дамой.

Итак, давайте узнаем, как он хочет это сделать ...

Во-первых, позвольте мне познакомить вас с актерами рассказа:

  • Ким: специалист по данным
  • Лина: Данные

Найдите свою дату

Этот шаг может показаться очевидным, однако это не так!

В реальных случаях извлечение достаточного количества информации, например данных, может либо привести вас в правильном, либо в неправильном направлении.

Чем выше качество данных, тем меньше у нас будет неопределенности, и наоборот.

Поэтому важно использовать правильный тип данных и помнить о том, что сбор данных может быть сложной задачей и потребовать много времени.

Планируйте дату

  • Что вы собираетесь делать со своими данными?
  • Установите цель, которую нужно достичь в конце обучения, чтобы избежать путаницы, вводящей в заблуждение (обратите внимание, что это часто случается).

Узнай свою дату

  • Сделайте некоторые визуализации и сводную статистику.
  • Поймите, о чем ваши данные. Хорошо знайте каждую функцию и спрашивайте ее качества.
  • Примените технику EDA (исследовательский анализ данных).

Ищите что-нибудь странное

Под странным мы подразумеваем данные с необычной ценностью, которые могут быть хорошими или плохими.

Некоторые выбросы могут помочь вам лучше понять ваши данные, в то время как другие можно игнорировать ... Если таковые имеются, исследуйте, почему значения отсутствуют в ваших данных, и, если возможно, найдите лучший способ вменения.

Возьми свое свидание

  • Попробуйте различные модели машинного обучения и тренируйте их на своих данных.
  • Каждая модель предназначена для определенных типов данных. Найдите одну и оптимизируйте ее.

Оцените свое свидание

  • Определите свои показатели и посмотрите, стоило ли все ваше обучение того.
  • Соответствует ли это вашим ожиданиям? В противном случае вы собираетесь больше тренироваться или собирать больше данных.

Заключение :

Это были ключевые шаги, которым должен следовать каждый специалист по данным, чтобы обеспечить надежную интерпретацию данных и содержательные результаты.

Если у вас есть какие-либо вопросы или комментарии, не стесняйтесь оставлять свои отзывы ниже или вы всегда можете связаться со мной через LinkedIn.

Спасибо за чтение и удачного свидания .. AKA Data;)