В связи с растущим спросом на науку о данных в науке о данных выполняется много проектных работ, особенно новичками и энтузиастами. Множество проектов, найденных в Интернете, способствует количеству, но не качеству. Качественный проект/публикация окажет большее влияние на ваше DS Journey, чем миллион посредственных. В этой статье я соберу советы и отзывы различных специалистов по науке о данных о реализации качественного проекта по науке о данных.

Во-первых, сохраняйте смысл

Первый и главный совет перед началом любого аналитического проекта — иметь четкую цель и требования к тому, что нужно решить. Часто проекты заканчиваются созданием информационной панели или модели машинного обучения без какой-либо постановки задачи или цели. Четкая постановка проблемы и поиск решения — вот что требуется отраслям.

Избегайте MNIST и Титаника

Не то чтобы я имел что-то против них, но, пожалуйста, избегайте этого. MNIST и Titanic хороши только тогда, когда вы начинаете глубоко погружаться в науку о данных. После этого он не будет иметь большой ценности, так как он слишком прост и не имеет большого влияния. Есть множество таких проектов, которых можно избежать.

Это не должно быть так сложно

Точно так же, как Data Science — это не только ML, проекты DS не обязательно должны быть ML. Я даже могу быть простой аналитикой, которая оказывает влияние. В большинстве случаев проекты оцениваются на основе их воздействия и удобства использования, а не сложности. Итак, найдите хорошую проблему и придумайте хорошее решение.

Выберите полноценный проект

Продолжая разговор с первого пункта, завершите проект реализацией. Если это визуализация, составьте презентацию и представьте свои выводы и выводы. Если это ML, спроектируйте настройку облачных ресурсов и разместите модель. Это окажет гораздо большее влияние, чем оставить его наполовину сделанным.

Прикладная или исследовательская сторона?

Работа в технологической отрасли может быть прикладной или исследовательской. Соответствующее согласование ваших проектов может сделать вас более подходящим для этой роли. Решение любой проблемы — это то, на что в основном нацелены прикладные проекты, в то время как инновации и усовершенствования — это то, на что нацелены исследования. Наличие публикаций будет большим плюсом для исследовательской роли.

Получите проверку

Держите эго в стороне и узнайте о недостатках вашего проекта. Обратитесь к эксперту и посмотрите, есть ли улучшения. Рецензирование открывает множество возможностей для совершенствования и обучения. Самое сложное — это судить о падении. Поскольку мы придумали идею и решение, мы будем колебаться, не увидев падений.

Попробуйте отказаться от общих репозиториев данных

Чтобы получить лучшее представление о реальности, отойдите от общих репозиториев данных, таких как GitHub и Kaggle, и попробуйте очистить или извлечь свои собственные данные. Не всегда обработанные данные легко доступны для проектов. Поскольку домен DS распространяется на данные + аналитику, понимание интеллектуального анализа данных будет большим плюсом.

Спасибо за чтение!

Полезные ссылки:

Найдите меня на LinkedIn: https://www.linkedin.com/in/vishnuu0399

Узнайте больше обо мне: https://bit.ly/vishnu-u