«Прежде чем мы начнем углубляться в тему, давайте сначала поймем, зачем нам машинное обучение, и зададим себе вопрос: действительно ли вам нужно изучать машинное обучение? Если да, то почему? "

(Примечание: это все мое мнение, поэтому используйте их для справки, но решайте, исходя из того, что вам больше подходит)

Предостережение. Если это только из-за ажиотажа вокруг технологий в последнее время пандемии, позвольте мне предупредить вас, что, без сомнения, это весьма полезная карьера, но она требует значительных усилий. время, целеустремленность и настойчивость, чтобы дольше оставаться в поле. Технология развивается с такой скоростью, что то, что вы можете узнать сегодня, может оказаться устаревшим или с меньшей вероятностью использоваться в практике в будущем, помните, что знания остаются навсегда. Итак, если вы настроены неукоснительно следовать карьерному пути и хотите обновлять себя, постоянно обучаясь, то я сердечно приветствую вас и поздравляю, поскольку вы только что выполнили серьезную задачу, которая заключается в том, чтобы настроить мышление на то, чтобы следовать этому как карьерному пути.

Предложение: если вы студент, у вас есть самый полезный ресурс, который жизнь может дать вам, как вы угадали, «Время», так что используйте его. чтобы изучить предметную область и укрепить свои основы. Если вы работающий профессионал, не стоит уходить с работы и изучать машинное обучение, если вы не планируете учебу в высшем учебном заведении. Со временем ваш опыт окупится. Все, что вам нужно, это выучить задачи «Приоритезация» и «Планирование», а не « Прокрастинация. » Итак, давайте начнем с первого понимания:

Что такое машинное обучение (ML)?

Проще говоря, все дело в «, а не в «магии», а в «математике». Не бойтесь, но будьте готовы окунуться в мир математики, чтобы по-настоящему понять технологию. Давайте просто оставим это на день и перейдем к типичному определению, которое гласит:

Википедия: Машинное обучение (ML) - это исследование компьютерных алгоритмов, которые автоматически улучшаются благодаря опыту. Он рассматривается как разновидность искусственного интеллекта (ИИ).

Без лишних слов, давайте перейдем к выбору правильного способа изучения машинного обучения.

Помните, вам сказали быть к чему-то готовым. Вот оно, и вы правильно угадали:

1. Математика и статистика:

Машинное обучение основано на математических предпосылках, а создание модели машинного обучения - это создание алгоритма, который может очень хорошо учиться на данных и генерировать удовлетворительные результаты на невидимых данных. (Обычно мы используем уже созданные алгоритмы, но, если вы можете создать новый, именно на это исследователи тратят время, разрабатывая новые методы с использованием этих знаний.)

«Мы всегда можем создать модель, которая даст вам хорошие результаты, но как узнать, лучшая она или где ее использовать? А вот и знание математики, которое позволяет вам выходить за рамки типичных решений »

Что изучать по математике для машинного обучения?

Что ж, вам нужно выучить правильную концепцию, и она довольно понятна (хотя базовые концепции), если вы хорошо разбираетесь в математике в средней школе, если нет, вернитесь к тем NCERT или любой другой учебник и начало, другого выхода здесь нет. Глубина концепций действительно зависит от роли, которую вы будете играть в любой организации, но вам нужно с чего-то начинать. «Сказал, чтобы вы были готовы».

Следовать:

1. Линейная алгебра

2. Исчисление

3. Статистика

4. Вероятность

Я не буду вдаваться в подробности каждой темы, а скорее предоставлю вам необходимые ресурсы (насколько мне известно), на которых можно учиться.

Откуда мне учиться?

Онлайн-курсы

1. Математический курс в Академии Хана: линейная алгебра, вероятность и статистика, многомерное исчисление и оптимизация.

2. Линейная алгебра от MIT Open Courseware от проф. Гилберт Стрэнг: Считается одной из лучших лекций, на которых можно учиться.

«Не стесняйтесь следовать тому, что соответствует вашему стилю».

3. Статистика:

  • Академия Хана видео по статистике.
  • Введение в статистику от Udacity.
  • Если у вас есть достаточно времени для изучения основ теории вероятностей, случайных величин, распределений вероятностей, проверки гипотез и т. Д., То я могу порекомендовать этот подробный курс Технологического института Джорджии Статистические методы ». Интуитивно понятный способ изучения вероятности и других связанных понятий.
  • Теория видения: один из лучших ресурсов для интуитивного понимания основ теории вероятностей. (Рекомендуется)

Ссылки на книги:

  1. Математика для машинного обучения Марк Питер Дайзенрот, А. Альдо Фейсал, Ченг Сун Онг: изучить концепции, лежащие в основе технологии. (Книга MML) (при необходимости откройте в браузере).

2. Введение в статистическое обучение: приложение с R: ISLR Независимо от того, выберете ли вы Python / R, эта книга предназначена для получения статистических знаний.

3. Open Intro Statistics: Установите цену на 0 долларов, чтобы получить его бесплатно, в противном случае вы всегда можете помочь автору по своему желанию.

4. Чтобы получить более подробные сведения, обратитесь к книге: Think Stats.

5. Элементы статистического обучения: интеллектуальный анализ данных, вывод и прогнозирование.

«Есть много других доступных ресурсов / книг, но хотелось бы, чтобы все было просто и не перегружало содержанием».

2. Машинное обучение, знаете, с чего начать?

Чтобы начать знакомство с миром машинного обучения, вы можете обратиться к этим курсам и книгам:

Онлайн-курсы

1. Coursera: Машинное обучение, Эндрю Нг.

Курс бесплатный, но без сертификации по завершении, но вы всегда можете подать заявку на финансовую помощь (обычно требуется 2–3 недели для утверждения). Примечание. Не начинайте аудит бесплатно, если подаете заявку на финансовую помощь.

2. MITOpenLearningLibrary: Введение в машинное обучение (6.036) - 13-недельная программа, предлагаемая бесплатно. Сертификатов нет, только для обучения.

3. Coursera: Практическое машинное обучение, Университет Джона Хопкинса.

4. Edx: Машинное обучение Колумбийского университета.

5. Посетите ai.google, чтобы получить более интересный контент и поучиться у экспертов по машинному обучению в Google.

Рекомендуемые книги:

1. Deeplearningbook: Теперь вам может быть интересно, откуда взялось это глубокое обучение? Просто обратитесь к первым 5 главам содержания ML с углубленной математикой. Обязательно прочтите заключительную книгу, если планируете роли инженера по машинному обучению (давайте поговорим о различных ролях в другой статье.)

2. Книга Распознавание образов и машинное обучение Кристофера Бишопа.

3. Научитесь кодировать

Подождите! «Кто-то сказал вам, что вы можете стать специалистом по данным / инженером по машинному обучению, не имея знаний в области программирования?» - Тем не менее, это дискуссионная тема, поэтому хорошо иметь знания в области программирования, так как это часто помогает вам пройти собеседования и укрепить вашу кандидатуру!

  1. Узнайте об основах информатики. Вы можете сразу перейти к изучению любого из языков программирования, но хорошо иметь базовые представления о поле / предмете, и вы можете посетить CS50x, чтобы хорошо начать. Чтобы получить подтвержденную сертификацию, посетите edx за определенную цену, но у вас есть возможность получить финансовую помощь (найдите ее в Интернете, чтобы узнать, как ее получить).

2. Выберите любой из предпочитаемых языков.

  • а) Открытый исходный код: Python / R и т. д. Обычно предлагают python, начните с того, что он удобен для пользователя и имеет хорошие библиотеки с сильным сообществом, готовым помочь, когда вы застряли. Но R более сфокусирован, когда анализ больше склоняется к статистике. Решите, с какой отраслью / целевыми компаниями вы хотите работать, или создайте собственный стартап, выбор за вами.
  • б) Коммерческие: SAS, SPSS и т. д.

3. Где научиться программировать? Что ж, здесь я не могу гарантировать вам справедливости, так как информации на этот счет предостаточно. Я могу предложить вам несколько, но не ограничивайте себя этими вариантами и в то же время не перегружайтесь содержанием. Просто выбирайте с умом и полностью следуйте по пути.

4. Самое главное: Практика! Упражняться! Практика!, да, вы угадали; вы можете получить знания о технологиях, пройдя курс, но работа над проектами добавляет изюминки.

а) Используйте различные онлайн-платформы для изучения и практики кода, некоторые из них включают. (Не в каком-либо определенном порядке)

  • Используйте GeeksforGeeks или W3School для прояснения основных понятий.
  • Обратитесь к Codeforces и решайте задачи в зависимости от уровня сложности (легкий ›› средний ›› сложный). Кроме того, вы можете ссылаться на другие веб-сайты:
  • FreeCodeCamp
  • Hackerrank
  • HackerEarth
  • Leetcode
  • Codechef.

Помните, что не следует заниматься несколькими веб-сайтами, выберите в соответствии с вашим пониманием и стилем обучения из доступных вариантов и создайте один сильный профиль для демонстрации, имея средний профиль на нескольких веб-сайтах.

б) каналы YouTube:

Примечание. « Я предоставляю дополнительные ресурсы, чтобы вы не тратили больше времени на чтение блогов о ресурсах и т. д.… Так что будьте очень осторожны и уделяйте много времени сортировке ресурсы в соответствии с вашими целями, но однажды начав с этого, постарайтесь избегать любых расхождений и придерживаться курса »- Всего наилучшего.

4. Разберитесь в базах данных.

По мере продвижения в этой области вы будете сталкиваться со многими типами данных, обычно в форме текста (а также изображения, аудио, видео и т. Д., Но давайте обсудим это позже). Итак, база данных почти всегда используется для хранения данных. Это может быть MySql, Postgres, MongoDB, Cassandra и т. Д.

Знание любой из баз данных становится важным. Теперь выбор остается за типом отрасли, компании и т. Д., С которой вы хотите работать. Некоторые из основных ресурсов для изучения этих инструментов перечислены ниже:

Изучить SQL

  • Mode’s SQL для абсолютных новичков.
  • Университет MongoDB
  • SQLZoo: серия практических упражнений и викторин для студентов, изучающих SQL.
  • DataMonkey
  • Datacamp: SQL (проверьте, подходит ли этот стиль вашему способу обучения, всегда полезно иметь возможность)
  • Сервер Advanced SQL
  • Для Индексирования: очень подробно разобраться в концепциях.
  • Quip: Практикуйте лучшие ответы на собеседование по SQL для аналитиков данных средней сложности здесь.
  • SQL Примеры из практики: Проблемы, которые необходимо решить, связанные с реальными проблемами науки о данных.
  • Практикуйте навыки SQL на Leetcode | Хакерранк |

5. Очистка основных данных, исследовательский анализ данных и инструменты бизнес-аналитики.

Почему? В реальном мире получить чистые данные непросто. Когда данные передаются в алгоритмы машинного обучения, необходимо соблюдать определенный набор правил, поскольку все, что ниже, - это математика. Таким образом, изменение данных (при простой очистке данных) является очень важным шагом еще до того, как мы начнем с построения модели машинного обучения.

«Обычно 60% времени тратится на очистку и обработку информации, 19% - на сбор правильной информации, что означает, что специалисты по данным тратят около 80% времени на вышеупомянутые действия, чем на создание машинного обучения. модель ».

«Мусор на входе, на выходе»

Очистка данных:

Курс:

Книги:

  • Преодоление данных с помощью Python: советы и инструменты, которые сделают вашу жизнь проще, Жаклин Казиль
  • «Очистка данных» Ихаба Ильяс и Сюй Чу.
  • «Лучшие практики очистки данных» Джейсона Осборна.

Инструменты:

  • Data Wrangler
  • Dplyr
  • OpenRefine
  • Python и панды

Составление отчетов:

В бизнесе важно донести информацию до других; аудитория может включать ваших коллег, которые знают о предметной области, и тех, кто не имеет никакого представления о технических аспектах. В этих случаях визуализации и интерактивные отчеты очень помогают в представлении работы и упрощают понимание бизнес-результатов тем, кто обладает минимальными техническими знаниями.

Наиболее часто используемые инструменты бизнес-аналитики

Таблица:

Один из популярных инструментов визуализации, где вы можете потратить около 3-4 недель, чтобы хорошо овладеть базовыми и средними навыками составления отчетов.

PowerBI:

Еще один инструмент визуализации от Microsoft & довольно популярен благодаря доступной цене и возможностям по сравнению с другими.

  • Официальный веб-сайт Microsoft для изучения Power BI и Сообщество (при необходимости откройте в браузере) для поддержки.
  • Веб-семинар от Марко Руссо, чтобы погрузиться в хороший учебный ресурс Power BI для обучения визуальному типу.
  • Обучение Microsoft YouTube.

«Существуют различные инструменты визуализации, предлагаемые Qlikview, Datawrapper, Plotly, Fusion charts и т. д., и т. д., чтобы назвать несколько, я упомянул наиболее широко используемые. Вы всегда можете уточнить у целевой области и компаний, с которыми хотите работать, а затем выбрать какой-либо конкретный инструмент ».

6. Как получить опыт?

Учитывая рост спроса и усиление конкуренции, очень важно, чтобы вы демонстрировали свою работу через сильное портфолио и имели хорошие проекты (надеюсь, вы напишете об этом еще в одном блоге).

  • Если вы студент / недавно выпускник, попробуйте пройти стажировку на Internshala или на других платформах, связанных с этой областью, любыми способами.
  • Участвуйте в проектах с открытым исходным кодом на GitHub.
  • Участвуйте в конкурсах и хакатонах на
  • Kaggle
  • HackerEarth
  • Машинный взлом
  • TechGig
  • OpenML

«Работайте над любимым проектом. Вполне возможно, что это может быть что угодно в рамках вашей нынешней работы, в которой вы пытаетесь решить какую-то проблему и узаконить, насколько использование машинного обучения более полезно для бизнес-результатов. Я не могу больше подчеркнуть, насколько важно на протяжении всей карьеры в области Data Science / ML доказывать материальное и нематериальное влияние решения на бизнес »

Несколько способов улучшить свой профиль:

  • Если позволяет время, проводите учебные курсы. Dphi - одна из хороших платформ для начала.
  • Продемонстрируйте эти проекты, код, статьи, блоги и т. Д. На таких веб-сайтах, как GitHub | Kaggle | Tableau Public.
  • Создайте сильный профиль на платформах программирования в любом из вышеупомянутых списков.
  • Разработайте как минимум 2–3 конечных проекта машинного обучения от построения модели до развертывания (если вы можете начать с сбора данных), чтобы иметь хорошее представление о полном конвейере.
  • Обратитесь к одному из примеров проектов на моем GitHub для конечного проекта машинного обучения.

7. Что и за кем следовать?

Для блогов и статей.

Каналы YouTube, на которые следует подписаться.

  • 3Синий1Коричневый: для интуитивного понимания математики.
  • Курс прикладного искусственного интеллекта: просмотрите доступные бесплатные видеоролики, чтобы глубже понять темы, а также получить полезные советы по карьере.
  • MIT OpenCourseWare: для глубокого понимания концепций.
  • Лекс Фридман: видеоролики, посвященные исследованиям в области искусственного интеллекта, глубокого обучения, автономных транспортных средств и не только.
  • StatQuest с Джошем Стармером: для статистики и интуитивного понимания тем ML и, конечно же, для его вступительных песен :)
  • Deeplearning.ai: для концепции глубокого обучения. (имейте это на будущее)

Для платных курсов с соответствующей структурой.

Не в каком-то определенном порядке и не представляет его. Все содержимое уже доступно бесплатно, но расставить приоритеты, фильтровать содержимое - это большая проблема, и решать вам, поэтому эта статья вам поможет.

Люди, на которых можно подписаться через Twitter или другие платформы

«В произвольном порядке»

Веб-сайты для поиска работы (в произвольном порядке)

Большая часть работы, которую вы найдете, осуществляется через надлежащую сеть и рефералов, поэтому создайте сильный профиль в LinkedIn, подключитесь к соответствующим людям и поделитесь своими мыслями и знаниями с помощью статей, сообщений, проектов и т. Д. Улучшите свое общение: устное и письменное. Вежливо подходите к контактам, чтобы узнать больше об отрасли. Надеюсь, вы все преуспеваете в своей карьере, и желаю удачи. Обязательно используйте функцию оповещения о вакансиях, чтобы получать обновления.

Советы и подсказки для резюме

  • Рефералы, связи, коллеги - лучший способ получить максимальную выгоду, большинство вакансий не публикуются в Интернете, и если это так, есть тысячи кандидатов и ботов, с которыми нужно бороться. Старайтесь изо всех сил использовать свой уровень, чтобы использовать свою сеть, вы можете следовать нескольким советам, как показано ниже.
  • Правило большого пальца: делайте это просто, по делу и, самое главное, до одной страницы, если у вас нет опыта более 10 лет.
  • Всегда делайте свое резюме дружественным к ATS при подаче заявления на порталы вакансий.
  • Всегда описывайте свои проекты / работу, используя метод STAR (я оставлю это на ваше усмотрение).
  • Избегайте использования гиперссылок, если только не отправляйте их прямо в чей-то почтовый ящик.
  • Избегайте использования таблиц, верхних и нижних колонтитулов, строк и т. Д., Поскольку они могут неправильно анализировать информацию.
  • Всегда подстраивайте резюме под описание должности. Я знаю, что делать это все время - это непросто, но ориентируйтесь на компании и роли и обращайтесь к людям через LinkedIn.
  • Сопоставьте свое резюме с описанием должности и поставьте цель не менее 70% совпадения (хотя если оно составляет 50%, это считается хорошим), но чем больше процент совпадений, тем больше вероятность того, что ваш профиль попадет в финальный список. Совместное использование инструмента Сканирование вакансий используйте его, чтобы узнать о практике, и у него есть хорошие блоги и ресурсы, на которые можно сослаться.

«Надеюсь, это поможет вам приблизиться к вашей цели, поможет вам продвинуться в карьере»

Для подготовки к собеседованию / практики

  • Как отвечать на распространенные вопросы собеседований: Нажмите здесь, чтобы получить доступ к советам Гарвардской школы бизнеса онлайн.
  • Памятка для собеседования по телефону: Советы для достижения успеха: чтобы узнать больше о том, как пройти собеседование по телефону. Очень важно узнать постпандемию. Лист-1: Нажмите здесь, Лист-2: Нажмите здесь
  • Проверьте свои знания и понимание домена, сдав экзамен на Веб-сайт Workera

Я настоятельно рекомендую ознакомиться с этой дорожной картой, одной из лучших дорожных карт для машинного обучения - Дэниел Бурк, Щелкните здесь для доступа.

Надеюсь, вам всем понравился контент, и для начала у вас есть какая-то идея. Хотел бы поблагодарить все сообщество в этой области, поскольку без их помощи было бы невозможно научиться и зайти так далеко. Престижность каждому из вас, кто работает в этой области и делится знаниями.

Я поделюсь дополнительным контентом, связанным с машинным обучением / наукой о данных / анализом данных, подробно расскажу о них и, надеюсь, по более сложным темам. А до тех пор, Будьте осторожны и будьте осторожны.

ЕСЛИ ВАМ НРАВИТСЯ, ПОЖАЛУЙСТА, ДЕЛИТЕСЬ ЭТОМ В СВОЕЙ СЕТИ, ТАК, ВСЕ ПРЕИМУЩЕСТВА ЭТОГО И СЭКОНОМЬТЕ НЕКОТОРЫЕ ЦЕННОЕ ВРЕМЯ НА ПОИСК РЕСУРСОВ.

Хотелось бы получить отзывы от всех и приветствовать предложения или другие полезные ресурсы. пожалуйста, не стесняйтесь делиться своими мыслями в разделе комментариев ниже.

Не стесняйтесь подписываться на меня в LinkedIn | Твиттер

«Будут делиться тем же на других похожих веб-сайтах, чтобы помочь более широкому сообществу»

Комбинированные ресурсы

Щелкните здесь , чтобы получить доступ ко всем вышеупомянутым ресурсам в Блокноте для справки. (Здесь у вас есть доступ для редактирования файла и резервная ссылка.)

Использованная литература: