Советы по обработке естественного языка и машинному обучению

среда, 2 ноября 2016 г.

Кажется, все заинтригованы машинным обучением, которое в последнее время стало модным словечком. Несмотря на то, что это пугает, вы, безусловно, можете проникнуть в поле или узнать больше о другой фразе, которую мы часто слышим, об обработке естественного языка. Прочтите несколько советов и предыстории от специалиста по данным Лесли Кордеро, который преподает наш курс Наука о данных. Лесли также ведет занятия по машинному обучению для тех, кто интересуется конкретной областью.

В чем разница между машинным обучением и обработкой естественного языка (NLP)?

Оба похожи, потому что они позволяют прогнозировать на основе обнаружения закономерностей. Оба также похожи в том, что они в значительной степени полагаются на статистику.

При этом алгоритмы машинного обучения обычно относятся к таким алгоритмам, как регрессия, классификация, метод опорных векторов, деревья решений, случайный лес и т. д. Все эти алгоритмы используются для прогнозирования числовых данных. Обработка естественного языка — это более конкретная дисциплина, в которой применяются статистические модели и методы для выявления закономерностей в тексте/речи.

Какие советы по внедрению машинного обучения?

Быть сильным в математике и быть невероятно удобным с вероятностью, статистикой и линейной алгеброй.

Если вы хотите изучить теорию, лежащую в основе машинного обучения, я бы прошел полезный онлайн-курс, подобный тому, который предлагает Стэнфорд (скоро будет предлагаться Byte Academy). С технической стороны вы должны свободно владеть Python и R, особенно встроенными модулями, такими как nltk, sci-kitlearn и theano. Я преподаю эти предметы на Курсе по науке о данных, который преподаю в Byte Academy.

Подходящее ли сейчас время для начала карьеры в области машинного обучения?

Если вы спрашиваете, есть ли большой спрос на машинное обучение, короткий ответ — абсолютно. Есть много перспектив трудоустройства для людей с опытом машинного обучения, будь то в академических кругах или в промышленности. С учетом сказанного, карьера в области машинного обучения не делается за одну ночь. Определенно необходим солидный опыт в статистике и линейной алгебре, а также солидный опыт программирования (скорее всего, R или Python).

Если вам действительно нравится машинное обучение и у вас есть время, чтобы инвестировать в создание своей карьеры, я бы сказал, дерзайте! Проблема будет не в отсутствии рабочих мест, а, скорее, в отсутствии достаточного опыта.

Если вы хотите узнать больше о науке о данных/машинном обучении, ознакомьтесь с курсом Data Science от Byte Academy здесь.

Что значит быть инженером по машинному обучению или науке о данных?

Как и в случае с разработчиками программного обеспечения, суть вашей работы заключается в том, чтобы быть инженером. Таким образом, хотя ваша работа включает в себя концепции, лежащие в основе моделей машинного обучения, с которыми вы работаете, основное внимание вы уделяете фактической реализации. По моему собственному опыту, работа инженером данных требует гораздо меньшего количества математических приложений, чем работа исследователем данных.

Первоначально опубликовано на сайте byteacademy.co 2 ноября 2016 г.