Машинное обучение определяется как улучшение производительности или методы оптимизации машин при отсутствии явного программирования. Машины могут распознавать закономерности, прогнозировать и улучшать данные с течением времени благодаря машинному обучению. Есть несколько преимуществ машинного обучения. Один из них заключается в том, что разработчик не может предвидеть все вероятные ситуации, с которыми может столкнуться агент или программа. Другое дело, что мы редко не имеем ни малейшего представления о том, как запрограммировать решение. Например, как идентифицировать лица? Более того, из-за этого машины должны разбираться самостоятельно. В этом разделе будут обсуждаться три основных типа машинного обучения, которые включают контролируемое, неконтролируемое обучение и обучение с подкреплением.

Сравнимое с обучением под наблюдением обучение заключается в том, что пары информации передаются агенту, у которого есть вход и образец соответствующего соответствующего вывода. На примерах ИИ учится генерировать выходные данные, соответствующие образцам. Даже если входные данные не проходили через него ранее, примером контролируемого обучения будет набор данных истории продаж автомобилей для марки автомобиля, который может быть показан как набор пар, содержащих цену продажи и мощность каждого из них. машины. Используя эти числа, агент может разработать модель, способную рассчитать ожидаемую стоимость продаж, используя входную мощность. Это простая модель с одним выходом, в которой единственным фактором, влияющим на цену автомобиля, является его мощность. Цены на автомобили BMW, например, зависят от нескольких атрибутов, включая модель, интерьер/экстерьер и ряд других. Машинное обучение может использовать подробную историю продаж, содержащую эти атрибуты, для расшифровки более реалистичной и сложной модели, предсказывающей цену продажи с учетом всех этих атрибутов. Использование помеченных данных делает этот процесс контролируемым обучением. Почему контролируемое обучение так важно? Сложность прогнозирования продажных цен с использованием только лошадиных сил, и это связано с влиянием других неучтенных факторов, таких как репутация бренда, которая будет влиять на цену автомобиля. Поэтому важно иметь в виду, что он включает в себя обнаружение наиболее отличительных частей информационных пар, используемых в качестве обучающих данных. Различающие пары — это функции, которые каким-то образом связаны с помеченными данными. Обучение под наблюдением выполняет две разные задачи, имеющие разные приложения; две задачи - регрессия и классификация.

Классификация имеет дело с выходными данными, которые имеют дискретное значение, например, название типа памятника, присутствующего на изображении. В то время как регрессия имеет дело с числовыми результатами, например, с ценой на недвижимость. Существует несколько приложений для обучения под наблюдением, и они включают в себя ценообразование, классификацию текста, распознавание изображений, прогнозирование продаж, распознавание рукописного ввода и многое другое. Каковы недостатки контролируемого процесса обучения? Даже зная об особенностях создания системы машинного обучения, жизненно необходимо решать задачи, возникающие при создании обучающих данных. Следовательно, важно использовать человеческую метку, чтобы сделать справедливое предположение о выходных данных для входных данных обучающих данных, чтобы учесть любую форму разногласий между разными людьми, пытающимися применить метки к одним и тем же данным. Еще одна проблема для модели обучения с учителем заключается в том, что для создания достаточно большого набора данных требуется много времени, а также деньги, которые могут возникнуть из-за больших усилий, приложенных несколькими людьми для создания набора данных. Области, в которых уже имеется много подробных обучающих данных, доступны для применения к регрессионным и классификационным обучающим моделям. Например, в секторе здравоохранения, где в будущем здоровье человека можно будет прогнозировать с помощью прогностического анализа, не только используя данные о здоровье человека, но и создавая прогностические модели, используя медицинские записи людей по всему миру в качестве обучающего набора данных. В заключение, помеченные обучающие наборы данных используются контролируемым обучением для изучения функций или моделей, способных использовать входные данные для получения правильного вывода. Задачи регрессии и классификации выполняются с использованием обучения с учителем. Крайне важно определить характеристику входных данных, которая относится к выходным данным, т. Е. Разработка функций. Распознавание рукописного ввода, прогнозирование, распознавание изображений и некоторые другие приложения являются контролируемыми обучающими приложениями.

Обучение без учителя – это выявление шаблонов данных при отсутствии помеченных примеров или явной обратной связи, как при обучении с учителем. Кластеризация является наиболее распространенной задачей обучения без учителя, которая включает в себя группировку элементов обширного набора данных в подмножества наиболее похожих вещей.

Примером сегментации клиентов при неконтролируемом обучении является ситуация, когда количество клиентов в интернет-магазине составляет тысячу в день, и для рассылки покупателю привлекательного рекламного бюллетеня. Основная задача состоит в том, чтобы сгруппировать клиентов по трем основным типам в соответствии с их покупательскими предпочтениями, чтобы создать три отдельных рекламных бюллетеня. Неконтролируемое обучение осуществляется путем определения метода измерения расстояния и разницы между элементами набора данных или клиентами, использованными в примере. Алгоритм кластеризации выполняет кластеризацию, группируя элементы в зависимости от того, насколько они близки друг к другу и другим элементам. Сложность выделения группы кластеров, к которой принадлежат элементы, зависит от доступных функций. Существуют типичные приложения кластеризации, которые включают анализ социальных сетей, рекомендацию друзей в Facebook после определения группы людей, в которую можно попасть, уже обсуждавшуюся сегрегацию клиентов, определение корзин продуктов, определение того, какие продукты имеют вероятность быть купленными вместе. Неконтролируемое обучение также можно использовать для обнаружения наиболее распространенной модели данных датчика, которая создается в процессе производства, а затем с использованием выпадающих данных для проверки наличия ошибок в процессе. Кластеризация чаще всего представляет собой анализ начального уровня, выполняемый в процессе неконтролируемого обучения элементов данных или объектов. Давая программе входную подсказку о том, сколько кластеров или расстояние желательно, или предоставляя другие функции, она ускоряет процесс кластеризации по сравнению с полностью неконтролируемым обучением — проведением частично контролируемого обучения, когда вмешательство человека, например, оптимизация алгоритма кластеризации , или другие функции кластеризации несколько разумны. Таким образом, идея полуконтролируемого обучения, при котором частично управляемое человеком обучение без присмотра осуществляется для оптимизации производительности. Закономерности в данных выявляются с помощью неконтролируемого обучения. Кластеризация является наиболее распространенной задачей обучения без учителя. Обнаружение аномалий, анализ социальных сетей, разделение клиентов и ряд других действий, связанных с большим объемом данных и обнаружением закономерностей.

Машинное обучение определяется как улучшение производительности или методы оптимизации машин в…