По словам Артура Сэмюэля (1959),

Это область обучения, которая дает компьютеру возможность учиться без явного программирования.

Но как компьютер должен учиться? Том Митчелл говорит, что

Считается, что компьютерная программа учится на опыте E в отношении задачи T и некоторого показателя производительности P, если ее производительность на T, измеряемая P, улучшается с опытом E.

Например: Игра в шашки (Игра в шашки Артура Самуэля была одной из первых в мире успешных программ самообучения.) Вот,

E = the experience of playing many games of checkers
T = the task of playing checkers
P = the probability that the program will win the next game.

В целом, существует три типа алгоритмов машинного обучения:

  1. Контролируемое обучение
  2. Неконтролируемое обучение
  3. Обучение с подкреплением

Обучение с учителем:
Вот и мы - учителя. Мы сообщаем системе правильный ответ и обучаем ее до тех пор, пока система не начнет предсказывать с приемлемым уровнем точности. Мы можем дополнительно сгруппировать его в регрессию и классификацию.

Регрессия. Предположим, у вас есть набор данных о читательских привычках учащихся и их успеваемости на экзамене. Затем вы строите график «Количество часов обучения» и «Оценка за тест».

Вы можете ясно видеть, что если вы будете больше учиться, то сможете получить хорошие оценки. Итак, система разрабатывает функцию Y = f (x) [или ŷ = wx + b, где w - наклон, x - изученные часы, а b - точка пересечения с y]. Мы обучаем систему разработке функции с минимально возможной ошибкой. Затем, если новый ученик приходит и заявляет, что он / она учится 5 часов в день, мы можем предсказать, что он сможет получить определенную оценку за тест.

Классификация. Предположим, у нас есть набор данных по раку груди, и у нас есть такие функции, как возраст и размер опухоли.

На основе наших данных алгоритм создаст функцию отображения Y = f (x). Затем, когда мы предоставим новые данные, они позволят предсказать, является ли рак груди злокачественным или доброкачественным, в зависимости от размера и возраста опухоли. Как правило, у нас будет гораздо больше функций (толщина комков, однородность размера ячеек, однородность формы ячеек и т. Д.), Чтобы определить, 1 (злокачественный) или 0 (доброкачественный) [бинарная классификация].

Неконтролируемое обучение:
Здесь нам не дают правильный ответ. Вот данные. Делайте с ним то, что хотите. Алгоритмы предоставлены сами себе, чтобы изобретать и обнаруживать интересную структуру данных. Мы можем дополнительно сгруппировать его в алгоритмы кластеризации и ассоциации.

Алгоритм кластеризации: он объединяет похожие вещи. Мы не предоставляем никаких ярлыков, но система понимает данные и может дифференцировать их на основе обнаруженных функций. Одним из примеров использования кластеризации является Google News. Он группирует похожие новости с разных сайтов в сплоченные группы.

Алгоритм ассоциации: Вот данные, найдите связь.

На базовом уровне он анализирует данные на предмет шаблонов или одновременного появления в базе данных и определяет связи «если-то», которые называются правилами ассоциации. В продуктовом магазине, если мы знаем, что определенные товары часто покупаются вместе и находятся на одной полке, покупателям одного товара будет предложено купить другой. Рекламные скидки и рекламные объявления могут быть навязаны покупателю.
Давайте рассмотрим, itemset1 = {хлеб, молоко} & itemset2 = {хлеб, шампунь}. Вы можете догадаться, что itemset1 будет иметь более высокую поддержку (показатель того, насколько часто набор элементов встречается во всех транзакциях), чем itemset2.
Если в тележке есть {хлеб}, {молоко} имеет более высокую достоверность (мера вероятности появления набора товаров, если в корзине уже есть товары), чем {шампунь} .

Обучение с подкреплением.
Здесь машина находится в среде, где она постоянно обучается методом проб и ошибок. Эта машина учится на прошлом опыте и пытается собрать самые лучшие знания для принятия точных бизнес-решений.
Например: у вас есть агент и награда, а между ними много препятствий.

Здесь цель робота - добраться до награды (алмаз), избегая препятствий (огонь). Робот учится, пробуя все возможные пути и выбирая путь, который дает ему награду с наименьшими препятствиями. Каждый правильный шаг дает роботу награду, а каждый неправильный шаг вычитает награду робота. Общая награда будет рассчитана, когда она достигнет окончательной награды.