То, что вы не можете найти в чьем-то голосе, вы можете найти в чьем-то письме.

Вы перегружены всеми доступными ресурсами? Вот обновленный сборник лучших книг по науке о данных, которые нужно прочитать!

Я всегда был более склонен к видеоурокам / лекциям, когда дело доходило до самостоятельного изучения чего-либо из Интернета. Мне было легче (как и большинству из вас) понимать и не испытывать боли при чтении доступных книг. Я продолжал чувствовать то же самое, пока недавно я не обнаружил тех писателей или издателей, которые устранили элемент «скуки» из тематических книг и сделали их магически интересными.

Сегодня я поделюсь этими книгами со всеми энтузиастами науки о данных. Книги, которые заставят вас дважды подумать, прежде чем отвернуться от книг.

Давайте начнем . . .

Я разделил книги на разные области, чтобы облегчить выбор одной из них:

  • Книги по статистике / теории вероятностей
  • Книги по машинному обучению
  • Книги по визуализации данных и повествованию
  • Книги по глубокому обучению
  • Книги по обработке естественного языка (НЛП)
  • Книги по компьютерному зрению
  • Книги по искусственному интеллекту
  • Книги по инструментам / языкам

Книги по статистике

1. Введение в статистическое обучение

Авторы: Гарет Джеймс, Даниэла Виттен, Тревор Хасти и Роберт Тибширани

Неизменная классика. Эта книга охватывает базовую статистику, а также методы машинного обучения. В этой книге замечательно то, что каждая концепция объясняется с помощью тематических исследований на R. Итак, как только вы освоите программирование, вы всегда можете вернуться и снова опробовать каждую концепцию.

2 . Think Stats: Вероятность и статистика для программистов

Автор: Аллен Б. Дауни

Эта книга находится в верхней части большинства списков книг по науке о данных. В книге много ресурсов. Это будет особенно полезно для людей, знающих основы Python. Язык используется для демонстрации реальных примеров.

3. Искусство статистики: учиться на данных

Автор: Дэвид Шпигельхальтер

Гуманные примеры… практическое рассмотрение постановки задачи и постепенное и последовательное развитие интеллекта в направлении статистического решения данной проблемы. Короче говоря, статистика стала проще !!

4. Вероятность: для энтузиаста-новичка

Автор: Дэвид Морин

Идеальная книга для начинающих. Он написан для студентов колледжей, поэтому все, кто хочет изучить вероятность с нуля, оценят, как это написано. Охватываются все основы - комбинаторика, правила вероятности, теорема Байеса, математическое ожидание, дисперсия, плотность вероятности, общие распределения, закон больших чисел, центральная предельная теорема, корреляция и регрессия.

5. Введение в вероятность

Авторы: Дж. Лори Снелл и Чарльз Миллер Гринстед

Еще одна вводная книга, посвященная основным понятиям вероятности. Как и книга выше, эта представляет собой исчерпывающий текст, написанный для выпускников колледжей.

6. Голая статистика - избавление от страха перед данными.

Чарльз Уилан

Статистика иногда может быть сложной темой для погружения. Мало того, сосредоточение внимания на деталях иногда скрывает интуицию, лежащую в основе показателей, которые мы используем в работе. В этой книге автор поясняет ключевые концепции, такие как умозаключение, корреляция и регрессионный анализ, забавным и менее ужасным способом.

Книги по машинному обучению

1. Сотостраничная книга по машинному обучению

Автор: Андрей Бурков

Я люблю эту книгу Прочитав кучу книг, в которых пытались научить машинному обучению с разных сторон и точек зрения, я изо всех сил пытался найти книгу, которая могла бы лаконично резюмировать сложные темы и уравнения. Пока Андрею Буркову не удалось сделать это на каких-то сотнях с лишним страниц. Он красиво написан, прост для понимания и был одобрен такими лидерами мнений, как Питер Норвиг. Нужно ли мне сказать больше? Новичок или опытный, каждый специалист по данным должен получить в свои руки эту книгу.

2. Введение в науку о данных, автор: Дэви Силен и др., Опубликованный Manning Publications.

Мне нравится эта книга по особой причине: книги содержат не только темы науки о данных, которые мы видим повсюду, но и другие аспекты науки о данных как области {базы данных NoSQL, интеллектуальный анализ текста, анализ текста, первый шаг в больших данных, и особенно обработка больших данных на одном компьютере.} Понимание и работа с интеграцией баз данных в вашем проекте по науке о данных - действительно полезный и востребованный навык. Я настоятельно рекомендую прочитать это и более или менее ознакомиться с вышеупомянутыми дополнительными навыками в вашем арсенале.

3. Наука о данных с нуля Джоэла Груса, опубликованная O’Reilly

Второе издание этой книги уже выпущено, и она стала популярной благодаря тому факту, что в этой единственной книге в целом встречаются различные основы. Начиная с ускоренного курса Python, визуализации данных, линейной алгебры и статистики, вероятности, гипотез и выводов, получения и работы с данными и многих других тем, связанных с данными, включая машинное обучение, нейронные сети, рекомендательные системы, сетевой анализ и многое другое. Что ж. Это полный пакет услуг, и вам обязательно стоит подумать о его прочтении.

4. Справочник по науке о данных Python Джейка Вандерпласа, изданный О'Рейли.

Эта книга лучше всего подходит для тех, кто только начал заниматься анализом данных или наукой о данных и нуждается в справочной книге, чтобы сослаться на все методы и функции библиотеки и укрепить свои позиции в Python для науки о данных и позволить ему работать на вас. В книге очень подробно и глубоко рассматриваются эти темы: {IPython (интерактивный Python), Numpy, обработка данных с помощью Pandas, визуализация с помощью matplotlib, контролируемые и некоторые алгоритмы машинного обучения без учителя с помощью scikit-learn}. Количество и качество контента, доступного по этим темам, будут в значительной степени способствовать использованию ваших навыков на первых нескольких этапах любого цикла проекта в области науки о данных.

5. Постройте карьеру в области науки о данных Эмили Робинсон и Жаклин Нолис.

Источник: Мэннинг

Этот в основном посвящен техническим вопросам, связанным с изучением науки о данных. Опубликованный в 2020 году, он научит вас тому, как работает отрасль науки о данных. Вот почему это необходимо прочитать. Эмили и Жаклин проводят нас через поездку, начиная с решения, подходит ли нам карьера в области науки о данных, до различных типов рабочих мест в области науки о данных на рынке и от непрерывного процесса поиска работы.

6. Искусство науки о данных - руководство для всех, кто работает с данными

Роджер Д. Пэн и Элизабет Мацуи

В этой книге представлен отличный обзор рабочего процесса анализа данных. Более того, в нем хорошо сказано, что, несмотря на наличие множества инструментов, анализ данных, по сути, является искусством, предполагающим итеративный процесс, в котором информация изучается на каждом этапе.

Книги по визуализации данных и повествованию

1. Основы визуализации данных - Учебник по созданию информативных и убедительных рисунков

Клаус О. Вилке

В этой книге представлены основные принципы наряду с хорошими и плохими контрастирующими примерами визуализации данных. Это книга, которая может помочь вам понять логику эффективной визуализации и научить разрабатывать более значимые сюжеты, которые передают правильное сообщение.

2. Прекрасная визуализация, взгляд на данные глазами экспертов Джули Стил, Ноа Ильинский »

Авторы: Джули Стил, Ноа Ильинский
Веб-сайт: O’Reilly Media | Амазонка

«Красивая визуализация» исследует рассказывание историй с помощью данных, общение с помощью визуальных индикаторов, таких как цвет, и методы исследования, чтобы собрать все это воедино.

В этой книге описывается дизайн и разработка некоторых хорошо известных визуализаций. Это отличный способ узнать, как другие подходят к визуальному дизайну. Особое понимание состоит в том, что каждый автор отмечает, что сбор и очистка их данных - самая сложная часть любого проекта. Приятно осознавать, что это болезненная точка даже для лучших аналитиков!

3. MakeoverMonday - улучшение того, как мы визуализируем и анализируем данные, по одной диаграмме за раз

Энди Крибель

Эта книга является продолжением проекта #MakeOverMonday, в котором участники сообщества визуализации данных делятся своим улучшенным взглядом на существующие диаграммы и данные. Он подчеркивает, что, несмотря на вариативность в дизайне визуализаций, есть ключевые методы, которым можно следовать, чтобы убедиться, что ваша диаграмма оказывает влияние.

4. Истории с помощью данных - Руководство по визуализации данных для профессионалов бизнеса

Коул Нуссбаумер Кнафлик

Это книга, которую необходимо прочитать всем, кто хочет улучшить представление информации в ясной, краткой и графической форме. Эта книга учит вас основам визуализации данных и тому, как эффективно взаимодействовать с данными, вместе с многочисленными примерами из реальной жизни.

5. УЛУЧШЕННАЯ ВИЗУАЛИЗАЦИЯ ДАННЫХ: РУКОВОДСТВО ДЛЯ УЧЕНЫХ, ИССЛЕДОВАТЕЛЕЙ И ДОБЫЧИ ДЖОНАТАНА ШВАБИША

Автор: Джонатан Швабиш

Книга состоит из трех разделов. Он начинается с краткого руководства по передовым методам визуализации данных. Часть вторая составляет основную часть книги: типы диаграмм. Швабиш глубоко погружается в различные типы графиков, которые выходят далеко за рамки стандартов линий и столбцов. Он включает в себя содержательное обсуждение того, почему и когда каждый из них работает, а когда нет, с множеством примеров. В последнем разделе исследуется дизайн и дается направление для разработки и использования руководства по стилю визуализации данных.

Книги по глубокому обучению

1. Глубокое обучение с помощью Python

Франсуа Шоле

Действительно крутой способ изучения глубокого обучения (или машинного обучения в этом отношении) - программирование параллельно с теорией. Именно этому подходу следует Франсуа Шоле в книге «Deep Learning with Python». Понятия преподаются с использованием популярной библиотеки Keras. Франсуа - создатель Кераса, так кто лучше научит вас этой теме? Я также рекомендую следить за Франсуа в Твиттере - мы можем многому у него научиться.

Изображение с Amazon

2. Глубокое обучение с помощью Python

Автором этой книги является один из разработчиков библиотеки Keras, одной из самых известных библиотек машинного обучения Python. Книга начинается с практического подхода, потому что вы можете сразу изучить несколько полезных техник. Часто это невероятно реалистично, потому что вы сразу же примените его к занятиям сразу после прочтения. Это абсолютно необходимо прочитать в глубоком обучении.

3. Основы глубокого обучения с подкреплением - Теория и практика в Python

Авторы: Лаура Грэссер и Ва Лун Кенг

Довольно продвинутый учебник, в котором исследуется глубокое обучение с подкреплением, в котором искусственные агенты учатся принимать последовательные решения. Хорошо написанная книга для всех, кто имеет практические знания в области машинного обучения и хочет решать проблемы с помощью Deep RL.

4. Deep Learning Illustrated - визуальное интерактивное руководство по искусственному интеллекту.

Авторы: Джон Крон, Грант Бейлевельд и Аглае Бассенс

Это практическое руководство, которое поможет вам развить интуицию в алгоритмах глубокого обучения. В этом визуальном интерактивном руководстве вы изучите теории вместе с примерами, которые вы можете просмотреть в прилагаемых записных книжках Jupyter.

5. Машинное обучение Python

Автор: Орельен Жерон

Эта книга находится где-то между промежуточным и продвинутым этапами машинного обучения. Он будет обслуживать всех людей, которые являются специалистами в своей области, и тех, кто не является ими. Он начинается с мягкого введения в машинное обучение и глубокое обучение, а затем переходит к более продвинутым способам. Фантастическая книга!

Книги по обработке естественного языка (NLP)

1. Обработка естественного языка с помощью Python

Авторы: Стивен Берд, Юэн Кляйн и Эдвард Лопер

Еще одна книга в этом сборнике, посвященная политике «учиться на практике». Вы подберете концепции Python, которых иначе не было бы, и будете ориентироваться в мире НЛП с помощью библиотеки NLTK (Natural Language Toolkit). Хотя это не единственный ресурс, к которому вы обращаетесь при изучении НЛП (это слишком сложная область для этого), он предлагает довольно приличное введение в тему.

2. Основы статистической обработки естественного языка

Авторы: Кристофер Мэннинг и Хинрих Шутце

Опубликованный почти два десятилетия назад этот текст до сих пор служит отличным введением в обработку естественных языков. Это очень исчерпывающий справочник по более широким подтемам в НЛП, таким как категоризация текста, теги частей речи, вероятностный анализ и многое другое. Авторы тщательно изучают математические и лингвистические основы. Опять же, книга довольно подробна, так что имейте это в виду.

3. Обработка речи и языка

Авторы: Дэниел Джурафски и Джеймс Х. Мартин

Основное внимание в этой книге уделяется практическому применению и научной оценке естественного языка и речи. Я включил эту книгу, чтобы расширить наши горизонты за пределы текста, а также посмотреть на распознавание речи. И почему бы нет? Это область исследований, которая в настоящее время процветает, и каждый день выходит множество приложений. Джурафски и Мартин написали подробную книгу по НЛП и компьютерной лингвистике. Это от самих мастеров.

Книги по компьютерному зрению

1. Компьютерное зрение: алгоритмы и приложения

Автор: Ричард Селиски

Изучите в этой книге различные распространенные техники компьютерного зрения, особенно те, которые используются для анализа и интерпретации изображений. Хотя это было опубликовано почти 9 лет назад, примеры и методология, проиллюстрированные Ричардом Селиски, применимы и сегодня. Это всеобъемлющий текст, в котором используется научный подход к решению основных задач видения. Веб-сайт, на который я указал выше, содержит бесплатную копию книги в формате PDF.

2. Программирование компьютерного зрения с помощью Python

Автор: Ян Эрик Солем

Прежде чем погрузиться в эту замечательную книгу, перейдите на веб-сайт, на который я указал выше, и загрузите наборы данных, записные книжки с кодом и клонируйте упомянутый там репозиторий GitHub. Они будут отличными товарищами в этом ДЕЙСТВИТЕЛЬНО практическом введении в мир компьютерного зрения.

3. Компьютерное зрение: модели, обучение и выводы

Автор: д-р Саймон Дж. Д. Принс

Книга начинается с нуля, знакомя нас с концепциями вероятности, а затем быстро набирает обороты. Хотя для некоторых из представленных здесь фреймворков вышли и более продвинутые версии, эта книга, тем не менее, актуальна в текущем контексте. Введено более 70 алгоритмов, а текст красиво дополнен более 350 иллюстрациями.

Книги по искусственному интеллекту

1. Искусственный интеллект: современный подход

Авторы: Стюарт Рассел и Питер Норвиг

Книга, написанная Стюартом Расселом и Питером Норвигом? Я продана. Это ведущая книга по искусственному интеллекту. Более 1300 университетов в более чем 100 странах ссылаются / цитируют эту книгу в своих учебных программах. Учитывая авторов, неудивительно, что объем книги - 1100 страниц. Охватывая весь спектр компонентов ИИ - распознавание речи, автономные транспортные средства, машинный перевод и компьютерное зрение, среди прочего, это можно считать библией ИИ.

2. Искусственный интеллект для людей

Автор: Джефф Хитон

Каковы основные алгоритмы искусственного интеллекта? Эта книга содержит множество технических ноу-хау всего на 222 страницах. Это первый том серии книг по методам, лежащим в основе ИИ (размерность, метрики расстояния, кластеризация, расчет ошибок, восхождение на холм, Нелдер Мид и линейная регрессия). Также существует сопутствующий сайт, содержащий примеры, цитируемые в книге + репозиторий GitHub, содержащий код.

3. Главный алгоритм

Автор: Педро Домингос

Если вы ищете техническую книгу по ИИ, это не то. Однако это мастерский текст о том, как машинное обучение меняет бизнес, политику, науку и войну. Это вдумчивая и наводящая на размышления книга о том, где ИИ находится сейчас и куда он может в конечном итоге унести человечество. Найдем ли мы когда-нибудь единый алгоритм (или «Главный алгоритм»), который сможет извлекать все знания из данных? Присоединяйтесь к Педро Домингосу в его поисках, чтобы узнать.

Книги по инструментам / языкам

1. Изучение Pandas - обнаружение и анализ данных Python стало проще

Майкл Хейдт

Learning Pandas - еще одна книга для начинающих, которая дает вам технические знания, необходимые для точного анализа данных с помощью Pandas. Одним из лучших атрибутов этой книги о пандах является тот факт, что она сосредоточена только на пандах, а не на сотне других библиотек, таким образом, удерживая читателя от путаницы и провозглашая себя одной из лучших книг для изучения пандов. Книга эффективно проведет вас через установку библиотеки, создание сложных структур данных, получение данных из Интернета и, наконец, визуализацию результатов с помощью графиков и графиков. Кривая обучения не крутая, поэтому она привлекает много новичков.

2. Изучение библиотеки Pandas

Мэтт Харрисон

Простота, точность и универсальность - лучшие термины для описания этой книги. Названная одной из лучших книг по изучению пандов, эта книга сравнительно легкая по сравнению с другими книгами в списке. Это не тяжелая книга, но она дает пользователю представление о реальной власти, наделенной библиотекой Pandas. Хотя тот факт, что это относительно легкая книга, может не заинтересовать многих, они все будут упускать многое, поскольку книга, несмотря на ее легкость, очень к делу. Это означает, что он идеально подходит для людей, которые хотят как можно скорее понять основы Pandas, не тратя время на размышления. В книге подробно рассказывается о Pandas DataFrame и различных действиях, которые можно выполнять с помощью DataFrames.

3. Поваренная книга Pandas

Теодор Петру

Эту книгу можно назвать прекрасным справочником. В то время как все другие книги о Пандах соревнуются за звание «лучшей книги для изучения Панд», они пытаются дать вам исчерпывающие знания о библиотеке, эта книга выступает в качестве обязательного дополнения ко всем этим книгам. Имея более 95 рецептов, демонстрирующих возможности библиотеки, читатели смогут анализировать данные как никогда раньше. Книга дает вам знания о решении огромных вычислительных задач, создании сложных структур данных, получении большего смысла от ваших данных и многом другом.

4. Панды для всех: анализ данных Python

Дэниел Ю. Чен

Вы хотите заняться анализом данных, но у вас даже нет базовых знаний о Python? Не волнуйтесь, эта книга о пандах все решит. Зачем тратить деньги на другую книгу по Python, если у вас есть знания, необходимые для программирования на Python и Pandas, в одной книге? Эта книга предназначена для абсолютных новичков, у которых нет никаких знаний в области программирования. Он поднимает вас, направляет и направляет ваш разум, чтобы точно знать, что нужно для запуска анализа данных с помощью Python и Pandas. Как сказано в названии книги, она для всех. Это определенно делает его одной из лучших книг по изучению Pandas.

5. Практический анализ данных с помощью NumPy и Pandas

Кертис Миллер

Эта книга о пандах немного сложнее для понимания, и рекомендуется, чтобы кто-то имел небольшие знания о Pandas и NumPy, прежде чем начинать читать книгу. Помимо этого, эта книга очень всеобъемлющая и дает своим читателям возможность познакомиться не только с Pandas, но и с NumPy. Предоставляя базовые знания о Pandas, он также дает читателям знания о создании иерархических индексов с помощью DataFrames и их построении. Эта книга может не подойти новичкам, но это не мешает ей стать одной из лучших книг по изучению панд.

6. Прагматичный программист - Ваше путешествие к мастерству

Дэвид Томас и Эндрю Хант

Это вневременная книга, которая «исследует самую суть разработки программного обеспечения, независимо от какого-либо конкретного языка, фреймворка или методологии». В нем не только обсуждаются методы обеспечения адаптируемости и простоты повторного использования вашего кода, но также исследуются темы личной ответственности и развития карьеры.

7. Чистый код - руководство по созданию гибкого программного обеспечения

Роберт К. Мартин

В этой книге объясняются принципы и лучшие практики написания чистого кода, проиллюстрированные на нескольких тематических исследованиях. Для профессионалов в области данных, работающих в условиях совместной работы, важно, чтобы написание чистого кода - это навык, который может подготовить вас и вашу команду к созданию более качественных продуктов данных.

8. Свободный язык Python: ясное, краткое и эффективное программирование

Автор: Лучано Рамальо

Ресурсов для изучения Python слишком много, но ничто так не учит программированию, как старая добрая книга. Как и следовало ожидать от книги по кодированию, это практическое руководство, которое поможет вам понять, как работает Python и как писать потрясающий и эффективный код Python. Лучано Рамальо также описывает несколько популярных библиотек, которые вы регулярно используете в проектах по науке о данных. Эта книга объемом 794 страницы стоит потраченных средств.

9. Программирование на Python: мощное объектно-ориентированное программирование

Автор: Марк Лутц

Подождите, еще одна книга о Python ?! Если вы думали, что эта книга научила вас всему, что вам нужно знать о Python, подумайте еще раз. Это обширный язык программирования, о котором еще предстоит рассказать. Освоив основы приведенной выше книги Лучано Рамальо, взгляните на эту книгу Марка Лутца. Существуют подробные учебные пособия по широкому кругу тем: базы данных, сети, обработка текста, графические интерфейсы пользователя и т. Д. Включены тонны и тонны примеров. Обязательно к прочтению для компьютерных фанатов.

10. Освоение Python для науки о данных

Автор: Самир Мадхаван

Две книги, которые мы рассмотрели для изучения Python, рассматривают язык с точки зрения программирования. Пришло время изучить это с точки зрения науки о данных. Какие библиотеки науки о данных обычно используются и как? Как вы можете создавать визуализации данных и искать шаблоны в Python? И как вы можете кодировать передовые методы науки о данных / машинного обучения для построения моделей? На эти и другие вопросы отвечает Самир Мадхаван в этой прекрасной статье.

11. R для науки о данных

Авторы: Гарретт Гролемунд и Хэдли Уикхэм

Любой, кто хоть сколько-нибудь слышал о программировании на R, наверняка заметит работу Хэдли Уикхэм. Его работа на этом языке не имеет себе равных - я мог бы продолжать о нем. Я не мог порекомендовать эту книгу достаточно высоко. Вы узнаете, как импортировать различные типы данных в R, различные структуры данных, а также как преобразовывать, визуализировать и моделировать ваши данные. Идеальная книга для изучения науки о данных с помощью программирования на R.

12. R для всех

Автор: Джаред П. Ландер

. Я получил эту книгу через одного из моих знакомых, и меня сразу поразило, насколько хорошо она написана. Он утверждает, что предназначен «для всех» и оправдывает свое название. Это отличная книга, если у вас нет технического и нестатистического образования.

13. Поваренная книга R

Автор: Пол Титор

The R Cookbook - отличное дополнение к вашему списку литературы по науке о данных. Он содержит более 200 практических рецептов, которые помогут вам начать анализировать и обрабатывать данные в R. Каждый рецепт рассматривает отдельную проблему. Он предназначен как для начинающих, так и для опытных пользователей, а также для опытных практиков. Эта поваренная книга для всех, будь то обучение новым навыкам программирования или освежение концепций.

ПОСЛЕДНИЕ МЫСЛИ

Идея этого блога заключалась в том, чтобы предоставить читателю лучшие книги по Data Science. Я подкрепил каждую рекомендацию кратким изложением, чтобы читатели могли выбирать в соответствии со своими ТРЕБОВАНИЯМИ, ИНТЕРЕСАМИ и БУДУЩИМИ ЗАДАЧАМИ.

Когда кто-то пытается вас запутать, помните следующее:

Вот несколько путей к успеху в науке о данных, и выбранный вами путь должен быть достаточно простым, чтобы помочь вам принять меры. Причина, по которой вы ошеломлены, - это информационная перегрузка, которую вам приносят эти варианты. Вместо того, чтобы тратить больше времени на размышления и планирование о приобретении навыков, просто выберите одну из вышеперечисленных книг в соответствии с вашими текущими потребностями и приступайте к работе. Главное - действовать последовательно.

Читайте с намерением узнать и открыть для себя волшебство, скрывающееся за умами этих великих авторов и практиков.

Удачного обучения !!!

Ваше здоровье