Новичок в науке о данных? Вот несколько мест для начала

Кто-то однажды сказал мне, что если вы отвечаете на вопрос более одного раза, вам следует просто написать об этом в блоге. Для всех, кто только начинает заниматься наукой о данных, вот как я начал свой путь: как и все остальные, я погуглил. Если вы это сделаете, вам будут представлены миллионы ресурсов, и я гарантирую, что вы не будете знать, с чего начать. Объем доступной информации огромен.

Я бы сказал, что знание статистики, математики и / или информатики очень важно. Мне посчастливилось закончить бакалавриат по математике и информатике. Однако эти навыки легко доступны в Интернете. В этой статье я поделюсь некоторыми использованными мною ресурсами.

Присоединяйтесь к более чем 15000 ваших коллег по машинному обучению и исследователей данных. Подпишитесь на главную рассылку новостей по глубокому обучению.

Я знаю, что существует так много бесплатных ресурсов, но если вам нужны рекомендации лучших профессионалов в отрасли, возможно, вам придется заплатить за некоторые из этих курсов. Эти веб-сайты обычно предлагают купоны, а иногда вы можете получить курс на 200 долларов за 10 долларов. Я не рекламирую ни один из этих сайтов, но поделюсь тем, чем пользовался.

  1. Образование Солнца Фрэнка Кейна. Фрэнк 9 лет проработал в Amazon и IMDb, занимаясь разработкой и управлением технологией, которая автоматически предоставляет рекомендации по продуктам и фильмам сотням миллионов клиентов. Его курс начинается с введения в статистику перед тем, как погрузиться в науку о данных.
  2. Питон для науки о данных и машинного обучения Bootcamp. Мне очень понравился этот курс. Очень хорошо, если у вас нет опыта работы с Python, потому что инструктор начинает с основ Python, которые вам понадобятся для науки о данных. Если вы уже знакомы с Python, можете просто пропустить эту часть. Инструктор Хосе Портилья охватывает большую часть того, что вам нужно знать об очистке данных, визуализации и машинном обучении. Он объясняет концепции способами, которые очень легко понять любому новичку.
  3. Deep Learning A-Z ™: практические искусственные нейронные сети. Кирилл Еременко объясняет интуицию, лежащую в основе каждого алгоритма, прежде чем Хаделин де Понтевес выполнит упражнения по коду. Мне нравится их глубокое понимание концепций, которые они преподают. Примеры, которые они используют, также очень интересны.
  4. Машинное обучение от А до Я ™: практический опыт Python и R в науке о данных. Это тоже Кирилл и Хаделин. Приведенные здесь концепции охватываются как Python, так и R. Мне не очень нравится R, поэтому я пропустил учебные пособия по R. Это отличный вариант, если вы хотите изучать Python и R.
  5. Введение в машинное обучение от Udacity. Один из преподавателей этого курса, Себастьян Трун, является одним из соучредителей Udacity. Он обладает обширным отраслевым опытом. Курс бесплатный.
  6. Введение в выводную статистику
  7. Введение в описательную статистику
  8. Путь обучения Springboard Некоторые хорошие люди в Springboard подготовили большинство вещей, необходимых для начала работы с наукой о данных.
  9. Учебные ресурсы Kaggle
  10. Kaggle Career Con 2018 видео. Ранее в этом году Kaggle организовал цифровую конференцию, целью которой было помочь студентам и специалистам по выбору профессии получить свою первую работу в области науки о данных.
  11. Карьера на Kaggle 2018 Ресурсы
  12. Я также использовал ядра Kaggle и соревнования Kaggle, чтобы посмотреть, что делают другие специалисты по данным.
  13. Блоги, которые я слежу: Трамплин, На пути к науке о данных, Мастерство машинного обучения, O’Reilly Media, Без догадок, Элитная наука о данных и Heartbeat
  14. Для наборов данных я использую Kaggle и UCI Machine Learning Repository.

Я также обнаружил, что обучение у других может быть очень хорошей стратегией. Вот пара людей, за которыми, на мой взгляд, было бы полезно следить, потому что они пишут в блогах о своем опыте работы с данными: Рунак Баник, Эхи Айгиомаву, Деррик Мвити, Кэтрин Гитау, Рэнди Лао, Кейт Страчни и Сирадж Раваль.

Я также нашел очень полезными официальные документы Python, Keras, Sklearn, Pandas и всех других пакетов, используемых в науке о данных. В конце концов, вы должны научиться их использовать.

Очевидно, это все еще ошеломляет того, кто только начинает. Я бы рекомендовал начать с курсов Udemy, упомянутых выше. Это потому, что их обучают профессионалы, и вы всегда можете задать им вопросы, когда застрянете. В противном случае у На пути к науке о данных и Heartbeat есть отличные ресурсы, чтобы вы могли начать работу бесплатно. Когда вы посещаете эти курсы, убедитесь, что вы пишете код и выполняете упражнения, иначе вы просто напрасно потратите свое время и ресурсы. Без постоянной и последовательной практики вы не сможете овладеть этими навыками.

Тем не менее, я должен сказать, что маловероятно, что вы станете профессиональным специалистом по данным, не вложив куда-нибудь несколько долларов. Так что разработайте план для этого. Наконец, по мере того, как вы узнаете, напишите статьи о том, что вы узнаете, чтобы вдохновить следующую душу, которая пробует свои силы в науке о данных.



Обсудите этот пост в Hacker News.

Примечание редактора. Heartbeat - это онлайн-публикация и сообщество, созданное авторами и посвященное предоставлению первоклассных образовательных ресурсов для специалистов по науке о данных, машинному обучению и глубокому обучению. Мы стремимся поддерживать и вдохновлять разработчиков и инженеров из всех слоев общества.

Являясь независимой редакцией, Heartbeat спонсируется и публикуется Comet, платформой MLOps, которая позволяет специалистам по данным и группам машинного обучения отслеживать, сравнивать, объяснять и оптимизировать свои эксперименты. Мы платим участникам и не продаем рекламу.

Если вы хотите внести свой вклад, отправляйтесь на наш призыв к участникам. Вы также можете подписаться на наши еженедельные информационные бюллетени (Deep Learning Weekly и Comet Newsletter), присоединиться к нам в » «Slack и подписаться на Comet в Twitter и LinkedIn для получения ресурсов, событий и гораздо больше, что поможет вам быстрее и лучше строить лучшие модели машинного обучения.