Руководство для начинающих практиков

«То, чему я научился самостоятельно, я до сих пор помню»

Н.Н. Талеб

Зачем вам это изучать?

Наука о данных за последнее десятилетие разрушила медицину, бизнес, политику и социально-экономическую сферу, автоматизируя и расширяя, в основном, от самых обыденных до даже систем экспертного уровня. Помимо этой шумихи, существует множество повседневных примеров того, как искусственный интеллект прорастает вокруг нас, даже если мы ничего этого не замечаем.

Многим инженерам-программистам и веб-разработчикам кажется привлекательным начать приобретать эти крайне желательные навыки, чтобы быть готовыми применять машинное обучение. Но их обычно пугает огромное количество предварительных условий для начала обучения.

Что вам нужно узнать?

Эти современные методы помогают принимать бизнес-решения, и их корни глубоко укоренились в методах, начиная от байесовского вывода, линейной алгебры, статистического моделирования, обработки естественного языка, выпуклой оптимизации, обработки данных, управления базами данных, поиска информации, больших данных и такой. Так что было бы здорово просмотреть эти концепции, прежде чем погрузиться в область науки о данных.

Наука о данных — это междисциплинарная область, в которой требуется знание четырех основных областей:

  1. Навыки взлома
  2. Визуализация данных
  3. Высшая математика
  4. Деловая хватка

Таким образом, знание R или изучение множества библиотек Python только улучшит ваши навыки взлома и потребует гораздо больше усилий в других областях.

Внимание! Не существует универсальной шаблонной модели, которая решит вашу бизнес-проблему. Следовательно, для широкого понимания различных методов и моделей потребуется гораздо больше усилий.

С чего начать изучение?

Большинство моих ресурсов по науке о данных и KDD включают KDnuggets Шапиро и Analytics Vidhya из Индии. У них обоих есть много ресурсов для того, чтобы вы начали искать работу в области науки о данных.

Включая ссылки и информацию на отличный начальный курс для всех новичков в машинном обучении, курс Эндрю Нг по Машинному обучению, а также последний курс по Глубокому обучению.

Набравшись достаточно уверенности, чтобы применить свои навыки, вы можете перейти к Kaggle и взять задачу для решения.

У старого доброго друга каждого разработчика Stack Overflow есть эти полезные дочерние сайты, ориентированные на предметную область.

Приняв участие в борьбе и развернув модели прогнозирования на рабочем уровне, вы поймете неправильные представления, связанные с шумихой, и научитесь эффективно общаться, получая согласованные результаты для продвижения бизнес-решений с использованием данных.

Приложение

Счастливого обучения!