Многие из вас, должно быть, очень увлечены машинным обучением и наукой о данных, но, как и большинство других парней, вы думаете: «С чего мне начать, что мне нужно изучить, прежде чем даже думать об ML?» и что "нет . Итак, вот мои советы о том, как вы можете начать заниматься машинным обучением и сделать карьеру для себя.

1. Примите решение

Первый и самый важный шаг на пути к росту в любой области — это принять решение. Четко определите, чем вы хотите заниматься, и это нормально — пробовать себя в разных областях, но никогда не начинайте что-либо делать только ради этого. Выполните несколько проектов в этой области, а затем выясните, полезно ли это для вас, действительно ли вам нравится это делать?

2. Питон

Существует много языков, с которых вы можете начать свой путь в качестве энтузиаста машинного обучения, таких как R, MATLAB, Lisp, Java и т. д., но наиболее широко распространенным языком является python, многие библиотеки имеют встроенные модели для python и Самое приятное в этом то, что у него есть одно из лучших сообществ, которым вы можете помочь. Это очень удобно для начинающих и легко понять. Вам не нужно быть экстраординарным программистом на любом языке, просто привыкните к базовому синтаксису, словарям и спискам Python, имейте в виду, что никто не знает всего, все мы пользуемся помощью Google. Вы можете изучить его практически из любого места, подойдет любой плейлист YouTube или курс udacity. Если вы спросите меня, то есть действительно простая и хорошая книга под названием Python Crash Course, написанная Эриком Маттесом. в этой книге есть несколько проектов, которые действительно хороши и интересны, поверьте, вам понравится.

3. Библиотеки и предварительные условия

Есть некоторые библиотеки, которые в основном являются основой ML в Python, вы должны знать их, прежде чем создавать модели или играть с данными. Библиотеки: Matplotlib, Numpy, Pandas и некоторая обработка файлов. Лучший ресурс, который я могу предложить для этого раздела, — это книга под названием OReilly Python for Data Analysis. Эта книга просто потрясающая, и да, в этом разделе вам действительно нужно потратить некоторое время, позже все может стать сложно, но нет необходимости делать все за один раз, прочитайте первую главу библиотеки, скажем, Numpy, попрактикуйтесь это потом позже, когда вы думаете, что вам действительно нужно прочитать главу Advance Numpy. Вы не поймете и не запомните все, но поверьте мне, никто этого не делает, просто поймите это и, выполняя анализ данных, если вам нужно, прочитайте его снова.

3. Математика, стоящая за алгоритмами

Кто-то может сказать, что если вам не нравятся математика или вероятность, то, пожалуйста, оставьте ML, я не скажу, что это заблуждение, но и не на 100% правда. Дело в том, что иногда вам действительно нужно знать, что на самом деле происходит за магией алгоритмов ML, или вам нужно выполнить некоторую настройку гиперпараметров, но вы можете спросить я могу легко найти, какие параметры настроить в Google,Да, вы поймете, но не поймете, почему я это делаю, или вы можете по ошибке настроить некоторые параметры неправильно. Алгоритмы действительно помогают построить способность модели обучаться в данной ситуации, и очень важно знать, в противном случае вы потратите месяцы (в некоторых случаях и годы) на обучение модели, которая не показывает удовлетворительных результатов, и есть много тому примеров. Если вы увлекаетесь машинным обучением, то, скорее всего, вы слышали об Эндрю Нг и его курсах, они действительно хороши. По моему мнению, лучший курс — это Машинное обучение Эндрю Нг, он бесплатный и если вы хотите сертификат, то вы должны заплатить



4. Модели и оценка

Теперь, когда вы знаете все, что нужно для изучения моделей ML и EDA. Для этого раздела есть несколько очень хороших библиотек на Python, одна из них Scikit-Learn. Он включает в себя различные алгоритмы, такие как случайные леса, машины опорных векторов, а также поддерживает числовые и научные библиотеки Python, такие как Numpy и Scipy. Есть несколько встроенных наборов данных для практических целей. Сначала вам может показаться, что это трудно понять, но с практикой вы привыкнете к этому. Ресурсы, которые я хотел бы порекомендовать:

  • Практическое машинное обучение с помощью Scikit-Learn и Tensorflow

Эта книга просто отлично подходит для некоторых концепций и алгоритмов глубокого уровня. Я настоятельно рекомендую вам читать эту книгу вместе с другими курсами.

  • От нуля до мастерства – комплексное машинное обучение и наука о данных

Онлайн-курс всегда интереснее скучного PDF-файла, особенно когда инструктор увлекается. Этот курс на сегодняшний день является лучшим курсом, если вы хотите начать с нуля. Преподаватель Дэниел Бурк очень четко объяснит вам каждую концепцию, вы можете следить за ним там, у него также есть канал на Youtube, и лучшая часть этого курса - это сообщество разногласий. Если вы спросите меня, с чего начать, я обязательно попрошу вас пройти этот курс, содержание потрясающее, охватывает все, от базового Python до Tensorflow. В нем также есть несколько проектов.



  • Прикладная наука о данных со специализацией Python

Если вы выполнили вышеуказанные шаги, значит, у вас есть знания о моделях машинного обучения, и вы можете двигаться дальше самостоятельно, и если вы действительно хотите углубиться, то этот курс для вас. Это немного сложнее, чем вышеуказанные ресурсы. Курс предоставлен Мичиганским университетом и представляет собой специализацию из 5 курсов.



  • Другие отличные курсы

Существует бесконечное количество ресурсов для дальнейшего развития, некоторые из них — это материалы deep Learning.io от Coursera или fast.ai (бесплатно). Несмотря на то, что deep learning.io платный, вы можете легко получить к нему доступ с Youtube.

Одним из замечательных ресурсов по математике являются материалы академии Хана, они просто потрясающие.

Существуют сотни и тысячи видео и блогов, за которыми можно следить совершенно бесплатно.

5. Ничего, только курсы

Теперь, если вы сделали 2-3 курса по теме, вы можете подумать, что знаете все, но поверьте мне, одними курсами вы ничего не добьетесь.

Последняя и самая важная часть этого блога посвящена проектам. Проекты необходимы. Есть сайт под названием kaggle, на котором проводится множество соревнований по науке о данных и машинному обучению, и я регулярно в них участвую. Тратьте больше времени на проекты, чем на курсы, если вы знаете основы. Никто не возьмет вас на работу на основе пройденных вами курсов, сделайте несколько проектов, чтобы почувствовать магию машинного обучения.

Спасибо.

Ришик