Машинное обучение

В этой статье кратко изложены некоторые вводные элементы машинного обучения для тех, кто плохо разбирается в областях STEM.

В мире машинного обучения компьютеры похожи на людей в том, что они не могут учиться ни на чем. Они требуют либо идеального кода (кода, который может учитывать все возможные входные данные), либо идеального количества примеров (данных), чтобы делать выводы. Поскольку мы, люди, не можем написать идеальный код, мы должны стремиться предоставить большое количество образцов для обучения машины.

Суть машинного обучения заключается в том, чтобы научиться распознавать сложные закономерности, которые либо невозможно обнаружить человеку, либо для их различения требуется много времени.

Машинное обучение в основном подразделяется на три категории:

  • Неконтролируемое обучение
  • Контролируемое обучение
  • Обучение с подкреплением

Обучение без учителя

В машинном обучении одной из основных категорий, используемых в настоящее время многими интернет-магазинами/медиа-сайтами, является обучение без присмотра.

Неконтролируемое обучение использует предоставленные пользователями данные и группирует их в более мелкие группы, называемые кластерами. Затем он использует эти кластеры и получает новые данные, настраивая параметры этих кластеров в соответствии с их назначением.

Вот пример, который поможет понять:

Пример:

Интернет-магазин Amazon.com, Inc использует неконтролируемое обучение, чтобы предлагать продукты пользователям, просматривающим Интернет.

  • Шаг 1) Например, вы покупаете копию «Ромео и Джульетты». Система может дать книге определенные теги, такие как «Шекспир», «Романс» и «Трагедия».
  • Шаг 2) Затем система предлагает другие книги с похожими тегами. Допустим, он показал предложенные книги «Отелло», «Король Лир» и «Буря».
  • Шаг 3) Если вы нажмете на одно из этих предложений и купите «Буря», внутренний рейтинг совместимости этой книги повысится.
  • Шаг 4) Таким образом, кластер, происходящий из «Ромео и Джульетты», будет иметь более высокую точность и более убедительно предложит «Буря» другим пользователям.
  • Шаг 5) Со временем эти кластеры могут выявлять закономерности и давать более качественные рекомендации на основе наблюдаемого коллективного поведения пользователей.

Контролируемое обучение

С другой стороны, контролируемое обучение — это метод машинного обучения, при котором компьютеру дается «правильный ответ», к которому нужно стремиться, а затем машина пытается сопоставить свой ответ с тем, что она узнала из своих «помеченных обучающих данных».

Машинное обучение с контролируемым обучением сначала предоставляет набор данных с оптимальным решением для этого набора. Учитывая эти данные, машина пытается разработать алгоритм для учета данных, уделяя большое внимание точности. Существенная проблема с этим заключается в том, что может быть предвзятость. Большинство машин используют компромисс смещения-дисперсии, чтобы определить, какой набор отдать приоритет, а какой игнорировать. В целом, чем меньше разброс данных, тем лучше этот метод.

Обучение с подкреплением

Обучение с подкреплением используется в обоих методах. Идея обучения с подкреплением заключается в том, что машина получает «положительную» обратную связь, когда выполняет задачу. Это говорит машине, что она принимает правильное решение. С другой стороны, он также дает отрицательную обратную связь, когда получает неправильный ответ.