Новичок в науке о данных? Вот несколько мест для начала
Кто-то однажды сказал мне, что если вы отвечаете на вопрос более одного раза, вам следует просто написать об этом в блоге. Для всех, кто только начинает заниматься наукой о данных, вот как я начал свой путь: как и все остальные, я погуглил. Если вы это сделаете, вам будут представлены миллионы ресурсов, и я гарантирую, что вы не будете знать, с чего начать. Объем доступной информации огромен.
Я бы сказал, что знание статистики, математики и / или информатики очень важно. Мне посчастливилось закончить бакалавриат по математике и информатике. Однако эти навыки легко доступны в Интернете. В этой статье я поделюсь некоторыми использованными мною ресурсами.
Присоединяйтесь к более чем 15000 ваших коллег по машинному обучению и исследователей данных. Подпишитесь на главную рассылку новостей по глубокому обучению.
Я знаю, что существует так много бесплатных ресурсов, но если вам нужны рекомендации лучших профессионалов в отрасли, возможно, вам придется заплатить за некоторые из этих курсов. Эти веб-сайты обычно предлагают купоны, а иногда вы можете получить курс на 200 долларов за 10 долларов. Я не рекламирую ни один из этих сайтов, но поделюсь тем, чем пользовался.
- Образование Солнца Фрэнка Кейна. Фрэнк 9 лет проработал в Amazon и IMDb, занимаясь разработкой и управлением технологией, которая автоматически предоставляет рекомендации по продуктам и фильмам сотням миллионов клиентов. Его курс начинается с введения в статистику перед тем, как погрузиться в науку о данных.
- Питон для науки о данных и машинного обучения Bootcamp. Мне очень понравился этот курс. Очень хорошо, если у вас нет опыта работы с Python, потому что инструктор начинает с основ Python, которые вам понадобятся для науки о данных. Если вы уже знакомы с Python, можете просто пропустить эту часть. Инструктор Хосе Портилья охватывает большую часть того, что вам нужно знать об очистке данных, визуализации и машинном обучении. Он объясняет концепции способами, которые очень легко понять любому новичку.
- Deep Learning A-Z ™: практические искусственные нейронные сети. Кирилл Еременко объясняет интуицию, лежащую в основе каждого алгоритма, прежде чем Хаделин де Понтевес выполнит упражнения по коду. Мне нравится их глубокое понимание концепций, которые они преподают. Примеры, которые они используют, также очень интересны.
- Машинное обучение от А до Я ™: практический опыт Python и R в науке о данных. Это тоже Кирилл и Хаделин. Приведенные здесь концепции охватываются как Python, так и R. Мне не очень нравится R, поэтому я пропустил учебные пособия по R. Это отличный вариант, если вы хотите изучать Python и R.
- Введение в машинное обучение от Udacity. Один из преподавателей этого курса, Себастьян Трун, является одним из соучредителей Udacity. Он обладает обширным отраслевым опытом. Курс бесплатный.
- Введение в выводную статистику
- Введение в описательную статистику
- Путь обучения Springboard Некоторые хорошие люди в Springboard подготовили большинство вещей, необходимых для начала работы с наукой о данных.
- Учебные ресурсы Kaggle
- Kaggle Career Con 2018 видео. Ранее в этом году Kaggle организовал цифровую конференцию, целью которой было помочь студентам и специалистам по выбору профессии получить свою первую работу в области науки о данных.
- Карьера на Kaggle 2018 Ресурсы
- Я также использовал ядра Kaggle и соревнования Kaggle, чтобы посмотреть, что делают другие специалисты по данным.
- Блоги, которые я слежу: Трамплин, На пути к науке о данных, Мастерство машинного обучения, O’Reilly Media, Без догадок, Элитная наука о данных и Heartbeat
- Для наборов данных я использую Kaggle и UCI Machine Learning Repository.
Я также обнаружил, что обучение у других может быть очень хорошей стратегией. Вот пара людей, за которыми, на мой взгляд, было бы полезно следить, потому что они пишут в блогах о своем опыте работы с данными: Рунак Баник, Эхи Айгиомаву, Деррик Мвити, Кэтрин Гитау, Рэнди Лао, Кейт Страчни и Сирадж Раваль.
Я также нашел очень полезными официальные документы Python, Keras, Sklearn, Pandas и всех других пакетов, используемых в науке о данных. В конце концов, вы должны научиться их использовать.
Очевидно, это все еще ошеломляет того, кто только начинает. Я бы рекомендовал начать с курсов Udemy, упомянутых выше. Это потому, что их обучают профессионалы, и вы всегда можете задать им вопросы, когда застрянете. В противном случае у На пути к науке о данных и Heartbeat есть отличные ресурсы, чтобы вы могли начать работу бесплатно. Когда вы посещаете эти курсы, убедитесь, что вы пишете код и выполняете упражнения, иначе вы просто напрасно потратите свое время и ресурсы. Без постоянной и последовательной практики вы не сможете овладеть этими навыками.
Тем не менее, я должен сказать, что маловероятно, что вы станете профессиональным специалистом по данным, не вложив куда-нибудь несколько долларов. Так что разработайте план для этого. Наконец, по мере того, как вы узнаете, напишите статьи о том, что вы узнаете, чтобы вдохновить следующую душу, которая пробует свои силы в науке о данных.
Обсудите этот пост в Hacker News.
Примечание редактора. Heartbeat - это онлайн-публикация и сообщество, созданное авторами и посвященное предоставлению первоклассных образовательных ресурсов для специалистов по науке о данных, машинному обучению и глубокому обучению. Мы стремимся поддерживать и вдохновлять разработчиков и инженеров из всех слоев общества.
Являясь независимой редакцией, Heartbeat спонсируется и публикуется Comet, платформой MLOps, которая позволяет специалистам по данным и группам машинного обучения отслеживать, сравнивать, объяснять и оптимизировать свои эксперименты. Мы платим участникам и не продаем рекламу.
Если вы хотите внести свой вклад, отправляйтесь на наш призыв к участникам. Вы также можете подписаться на наши еженедельные информационные бюллетени (Deep Learning Weekly и Comet Newsletter), присоединиться к нам в » «Slack и подписаться на Comet в Twitter и LinkedIn для получения ресурсов, событий и гораздо больше, что поможет вам быстрее и лучше строить лучшие модели машинного обучения.