Хотя обучение навыкам Data Science с помощью видео кажется проще и экономит время, лично мне нравится держать печатные копии нескольких выбранных книг в пределах досягаемости руки от моего рабочего стола.

Изучение науки о данных по книгам может быть лучшим вариантом, чем обучение по видео, по нескольким причинам:

  1. 🎓 Глубина содержания. Книги по науке о данных, как правило, более полны и содержат подробные объяснения концепций, методов и теорий. Это может быть особенно полезно для тех, кто хочет понять основные принципы науки о данных и то, как работают различные методы и алгоритмы.
  2. 📚 Справочные материалы. Книги могут служить справочными материалами для использования в будущем, облегчая повторение тем или понятий, которые вы, возможно, изучили ранее. Это особенно полезно для тех, кто только начинает заниматься наукой о данных и хочет создать прочную основу знаний.
  3. 🧠 Активное обучение. Чтение книг требует активного участия и активного обучения, так как вы должны обрабатывать и понимать информацию самостоятельно. Это может привести к лучшему запоминанию и более глубокому пониманию материала.

Конечно, у всех разные стили обучения и предпочтения, поэтому в конечном итоге вам решать, что лучше для вас — обучение по книгам или по видео. У обоих есть свои преимущества и недостатки, и важно найти то, что лучше всего подходит для вас.

Вот 3 книги по науке о данных, которые я настоятельно рекомендую всем, 🆕 кто хочет изучать науку о данных или 📚 хочет иметь несколько очень хороших справочников. . Лично у меня есть все эти три книги.

1️⃣2️⃣3️⃣ Книги представлены в рекомендуемом порядке для оптимизации процесса обучения, поскольку последующие книги могут основываться на концепциях и идеях, представленных в предыдущих. Однако не обязательно строго следовать этому порядку, и вы все равно можете эффективно учиться, выбрав другую последовательность.

1. Основная математика для науки о данных

Это правда, что многие люди стремятся погрузиться в захватывающие и передовые методы науки о данных, такие как машинное обучение и глубокое обучение. Однако важно помнить, что математика, стоящая за этими передовыми методами, формирует основу науки о данных и имеет решающее значение для глубокого понимания предмета. Это особенно верно, если мы хотим рассматривать науку о данных как нашу долгосрочную карьеру, где поверхностное/расплывчатое понимание может привести к неприятностям.

Без четкого понимания математических концепций, таких как линейная алгебра, исчисление и вероятность, может быть трудно понять тонкости алгоритмов машинного обучения и моделей глубокого обучения. Кроме того, понимание математических концепций также может помочь вам избежать распространенных ошибок и точно интерпретировать результаты ваших моделей.

Почему эта книга? Я считаю, что автор (Томас Нилд) объясняет математические концепции очень интуитивно и понятно. Я помню, как в школьные годы учителя математики учили нас математическим понятиям, таким как экспоненциальный, логарифмический и число Эйлера, не помогая нам понять, почему мы это изучаем и как мы можем применить это в реальной жизни. Хотел бы я, чтобы математику преподавали именно так, как объяснил в этой книге Томас Нильд!

В этой книге вы сможете найти и узнать:

  • Используйте код Python и библиотеки, такие как SymPy, NumPy и scikit-learn, для изучения основных математических понятий, таких как исчисление, линейная алгебра, статистика и машинное обучение.
  • Понимать такие методы, как линейная регрессия, логистическая регрессия и нейронные сети, на простом английском языке с минимальными математическими обозначениями и жаргоном.
  • Выполните описательную статистику и проверку гипотез в наборе данных для интерпретации p-значений и статистической значимости.
  • Управление векторами и матрицами и выполнение декомпозиции матриц
  • Интегрируйте и развивайте дополнительные знания об исчислении, вероятности, статистике и линейной алгебре и применяйте их к регрессионным моделям, включая нейронные сети.
  • Ориентируйтесь на практической карьере в области науки о данных и избегайте распространенных ошибок, предположений и предубеждений, настраивая свой набор навыков, чтобы выделиться на рынке труда.

2. Справочник по науке о данных Python, 2-е издание

💡 если вам действительно нужно выбрать только 1 книгу. Это тот, который я настоятельно рекомендовал. Одним из аспектов работы специалиста по данным или инженера по машинному обучению, который часто занимает большую часть времени, является обработка данных. Эта очень практичная книга охватывает 70–80 % задач, которые нам нужно будет выполнить, с полезными приемами и советами по повышению производительности.

Python Data Science Handbook Джейка ВандерПласа — отличная книга для новичков (также хороша как справочник для ветеранов) в науке о данных по нескольким причинам:

  1. В центре внимания Python.В книге основное внимание уделяется использованию Python в науке о данных, который является популярным языком программирования в этой области. Книга охватывает основные библиотеки и инструменты для науки о данных, такие как NumPy, pandas, matplotlib и scikit-learn, что делает ее идеальным ресурсом для тех, кто только начинает работать с Python.
  2. Четкие пояснения. В книге даются четкие объяснения концепций и методов, используемых в науке о данных, что делает ее доступной для тех, у кого нет опыта работы в этой области. Объяснения сопровождаются практическими примерами, которые помогают закрепить понятия.
  3. Упор на практическое применение. В книге основное внимание уделяется практическому применению науки о данных, а не только теоретическим концепциям. Это делает его идеальным ресурсом для тех, кто хочет узнать, как решать реальные проблемы с данными.
  4. Всеобъемлющее освещение. Книга охватывает широкий круг тем, связанных с наукой о данных, включая исследование данных, визуализацию данных, манипулирование данными и машинное обучение. Это делает его отличным ресурсом для тех, кто хочет заложить прочную основу в науке о данных.

Ты найдешь:

  • Используйте код Python и библиотеки, такие как SymPy, NumPy и scikit-learn, для изучения основных математических понятий, таких как исчисление, линейная алгебра, статистика и машинное обучение.
  • Понимать такие методы, как линейная регрессия, логистическая регрессия и нейронные сети, на простом английском языке с минимальной математической записью и жаргоном.
  • Выполните описательную статистику и проверку гипотез в наборе данных для интерпретации p-значений и статистической значимости.
  • Управление векторами и матрицами и выполнение декомпозиции матриц
  • Интегрируйте и развивайте дополнительные знания об исчислении, вероятности, статистике и линейной алгебре и применяйте их к регрессионным моделям, включая нейронные сети.
  • Ориентируйтесь на практической карьере в области науки о данных и избегайте распространенных ошибок, предположений и предубеждений, настраивая свой набор навыков, чтобы выделиться на рынке труда.

3. Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow

«Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow» Орельена Жерона — отличная книга для изучения машинного обучения. Обратите внимание, что вышло 2-е издание книги. Если вы планируете получить книгу, настоятельно рекомендуем вам получить последнее издание, чтобы у вас была самая последняя версия кодов, которые работают без каких-либо модификаций (с тех пор некоторые коды изменились). Вот почему это книга №1, которую я рекомендую своим ученикам и всем, кто хочет иметь четкое представление о машинном обучении и глубоком обучении.

  1. Практика и практика.В этой книге используется практический подход, даны конкретные примеры и упражнения, которые помогут вам действительно понять концепции и методы. Независимо от того, новичок вы или эксперт, этот подход упрощает понимание и применение того, что вы изучаете.
  2. Всестороннее освещение тем машинного обучения и глубокого обучения. Эта книга охватывает широкий спектр тем машинного обучения, включая линейную регрессию, деревья решений, случайные леса, нейронные сети и глубокое обучение. Он также охватывает важные концепции, такие как разработка функций и оценка моделей, поэтому у вас будет всестороннее понимание области.
  3. Введение в лучшие в своем классе пакеты. В этой книге основное внимание уделяется использованию наиболее важных библиотек машинного обучения, таких как scikit-learn, Keras и TensorFlow. Эти библиотеки широко используются в промышленности, поэтому вы будете изучать актуальные и практичные инструменты. Кроме того, у всех них есть сильные сообщества и поддержка, поэтому вы всегда можете найти помощь, когда она вам понадобится.
  4. Легко понять.Объяснения в этой книге ясны и просты, что делает ее доступной даже для новичков в этой области. А практические примеры и фрагменты кода помогают закрепить концепции, так что к концу у вас будет четкое понимание.
  5. Идеально для всех. Независимо от того, являетесь ли вы новичком, только начинающим изучать машинное обучение, или экспертом, стремящимся углубить свои знания, эта книга идеально подойдет вам. Благодаря практическому подходу, всестороннему охвату и четким объяснениям вы не ошибетесь с этим.

Охват этой книги включает в себя:

  • Изучите ландшафт машинного обучения, особенно нейронные сети
  • Используйте Scikit-Learn для сквозного отслеживания примера проекта машинного обучения.
  • Изучите несколько моделей обучения, включая методы опорных векторов, деревья решений, случайные леса и ансамблевые методы.
  • Используйте библиотеку TensorFlow для создания и обучения нейронных сетей.
  • Погрузитесь в архитектуру нейронных сетей, включая сверточные сети, рекуррентные сети и глубокое обучение с подкреплением.
  • Изучите методы обучения и масштабирования глубоких нейронных сетей.

Отказ от ответственности: я не имею никакого отношения к издателю или авторам упомянутой книги. Эти рекомендации основаны исключительно на моем личном опыте и использовании книг. Я не получаю никакой компенсации за их упоминание. Я просто высказываю свое собственное непредвзятое мнение и предлагаю эти книги, основанные на моем личном опыте и убеждении, что они являются ценным источником для обучения.

Хотя наличие в вашей коллекции нескольких важных книг по науке о данных — отличный способ начать свое путешествие по науке о данных, также крайне важно следовать структурированному пути обучения, который систематически опирается на ваши знания. Поступая так, вы сможете избежать ловушек поэтапного подхода к обучению, что может привести к пробелам в вашем понимании и наборе навыков.

Чтобы помочь вам в этом, я создал комплексный план обучения, который сочетает в себе высококачественные курсы Udemy и конкурсы Kaggle для всестороннего и экономичного образования. Прочтите этот пост Комплексный путь обучения науке о данных: получите работу по науке о данных без степени 💰 $20 000 (даже с интерактивным путем обучения), чтобы узнайте, как вы можете взять под контроль свое образование в области науки о данных и достичь своих карьерных целей, не тратя целое состояние на получение степени.