Книги и подкасты, которые помогут вам стать лучше на любом уровне опыта

Как ученый-самоучка и эксперт по машинному обучению, проработавший в этой области более 5 лет, я прочитал много литературы, чтобы освежить свои навыки и стать конкурентоспособным экспертом.

В этой статье я хотел бы поделиться с вами несколькими книгами и подкастами, которые помогли мне в начале моего знакомства с наукой о данных, но я также хочу указать вам ресурсы, которые в настоящее время помогают мне оставаться в курсе последних событий. и тенденции в области науки о данных и машинного обучения.

Важно — Не ограничивайте себя!

На самом деле я собираюсь начать с ключевого сообщения, которое я хочу взять на вооружение с моей точки зрения: Не игнорируйте книгу или ресурс только потому, что в нем нет примеров кода на предпочитаемом вами языке программирования! Вы ли это? в Python и есть книга по прогнозному моделированию с примерами кода на R с отличными отзывами? Не сомневайтесь и берите!! Представленные автором концепции, методы и примеры практически в каждой книге по-прежнему сделают вас лучшим Data Scientist и, более того, вы будете медленно и неуклонно развивать навыки в новом языке, будь то R, Python, Julia или SQL, который окажется очень ценным для вас в долгосрочной перспективе!

Книги по науке о данных и машинному обучению для начинающих

Наука о данных с нуля

Настоящая классика! Эта книга немного похожа на «швейцарский армейский нож» и не только объясняет вам основные концепции науки о данных и машинного обучения, но также дает вам ускоренный курс по Python и показывает, какие библиотеки и фреймворки использовать. для ваших задач. Кроме того, он знакомит вас с SQL и дает представление об обработке естественного языка. Просто здорово, чтобы дать толчок вашей карьере в науке о данных.

Практическая статистика для Data Scientist

Одна из моих любимых книг по науке о данных, которую я уже прочитал дважды. Авторы объясняют наиболее важные статистические понятия для науки о данных в ясной и доступной форме и фокусируются на понятиях, которые действительно важны в вашей повседневной работе! Это особенно ценно, если вы не сильны в математике и статистике! У меня есть только первое издание с кодом на R. Кроме того, недавно обновленное второе издание включает примеры на Python.

Глубокое обучение с Python

Я купил первое издание книги пару лет назад, чтобы начать свои глубокие знания, и книга действительно не разочаровала! По данным Amazon, второе издание выйдет в октябре 2021 года и будет содержать более 50% нового контента. Так что, если вы можете подождать до тех пор, обязательно добавьте в закладки этот замечательный бестселлер Франсуа Шолле, который является автором Keras (одного из наиболее часто используемых API для глубокого обучения). Книга знакомит вас с концепциями и практическими приложениями в области компьютерного зрения, обработки естественного языка и генеративных моделей.

Создание приложений на основе машинного обучения

Вы спросите, сколько книг по машинному обучению вам действительно нужно? Что ж, эта книга отличается и определенно обязательна к прочтению! Не беспокойтесь, это не очередная книга, которая объяснит вам, как работает дерево решений, а отличный ресурс, который поможет вам спланировать, спроектировать и внедрить рабочий процесс машинного обучения от начала до конца. Что мне действительно понравилось в книге, так это избранные интервью, которые были взяты с экспертами по науке о данных в этой области, которые дают вам отличное представление о том, как они строят свои конвейеры машинного обучения.

Книги по продвинутой науке о данных и машинному обучению

Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow

Определенно, это одна из моих самых любимых книг по машинному обучению! Это книга-бестселлер № 1 в категории «Искусственный интеллект и машинное обучение» на Amazon, написанная Орельеном Жероном, бывшим руководителем отдела классификации видео на YouTube. В книге представлены отличные примеры кода Python, которые помогут вам в повседневной работе. Он начинается с введения базовых и продвинутых концепций машинного обучения, а затем очень подробно знакомит вас с экосистемой TensorFlow. Я считаю, что это лучшая книга для изучения TensorFlow на рынке!

Прикладное прогнозное моделирование

Должен признать, эта книга немного старше остальных (впервые опубликована в 2013 году). Тем не менее, на сегодняшний день это один из самых полезных и полных ресурсов для прогнозного моделирования, таких как задачи классификации и регрессии, которые я читал. Одним из авторов является Макс Кун, который разработал знаменитый пакет R для R и в настоящее время разрабатывает пакет tidymodels для RStudio, который в настоящее время является современной средой машинного обучения в R. Должен признать, что книга читается нелегко, потому что она более математическая, чем другие книги, представленные выше. Однако вы будете вознаграждены отличными концепциями и методами с уровнем детализации, которого вы не найдете в других ресурсах.

Проектирование приложений с интенсивным использованием данных: большие идеи, лежащие в основе надежных, масштабируемых и ремонтопригодных систем

Эта книга не является традиционной книгой по науке о данных и знакомит вас с такими важными понятиями, как масштабируемость, согласованность, надежность, эффективность и ремонтопригодность систем данных, которые на самом деле не упоминаются в других книгах выше. Честно говоря, это не легкое чтение, но я определенно рекомендую его, если вы хотите сделать еще один шаг вперед и разобраться в деталях проектирования (реляционных) баз данных, хранилищ данных NoSQL, потоков и т. д., которые необходимы при работе с массивными наборами данных. .

Подкасты

Если вы не любите читать или у вас нет времени, я бы посоветовал вам попробовать подкасты! Вы можете слушать их по дороге на работу или в университет, пока убираетесь в доме или готовите, а сейчас летом на пляже :) Это отличный и эффективный способ провести большую часть времени, которое у вас есть! А выбрать есть из чего! Затем я представляю вам два моих текущих фаворита:

Скептик данных

Одна из самых важных вещей, которая делает подкаст хорошим для меня, — это ведущий. Подкаст Data Skeptic Podcast ведет Кайл Полич, который действительно делает прослушивание интересным! У него невероятные знания в области науки о данных и машинного обучения, а также отличный способ модерировать свое шоу. Он регулярно приглашает экспертов в области науки о данных и рассказывает им об их повседневной работе, проблемах и опыте. Это очень познавательно и очень интересно для любого уровня опыта!

ИИ сегодня

Подкаст AI Today подготовлен командой cognilytica, которая фокусируется на исследованиях и состоянии внедрения ИИ в отрасли. В нем представлены работы продюсеров, однако мои любимые эпизоды — это переговоры с работающими экспертами в этой области, такими как специалисты по данным и машинному обучению, работающие в Heineken, Wells Fargo и многих других!