Сэр Шивам Коллур прекрасно объясняет модель машинного обучения с точки зрения непрофессионала в своей статье (Ссылка).

Позвольте мне резюмировать то, что говорится в статье.

Представьте себе гипотетический класс математики — учитель и его ученики. Итак, однажды учитель вместо того, чтобы заранее обучать новой концепции, прямо пишет вопросы на доске и также предлагает решение. После нескольких вопросов учащиеся в некоторой степени узнают некоторую закономерность в каждом вопросе, и после еще нескольких вопросов они могут решить проблемы этой новой концепции.

Теперь, что только что произошло здесь?

Студентов не обучали этой концепции раньше, но после некоторых практических вопросов студенты были «обучены» конкретному типу концепции. А так как у каждого ученика должен быть сформирован свой неповторимый узор, то их эффективность, которую можно определить по скорости и точности решения вопроса, должна быть разной.

Теперь, взяв приведенный выше пример в качестве аналогии с моделью машинного обучения, вопросы можно назвать «набором данных», а учащихся можно назвать различными «моделями» (на жаргоне машинного обучения), которые были «обучены» на набор данных. Различные модели (учащиеся по аналогии) имели разную эффективность, основанную на разных типах вопросов. Точно так же разные модели обучения в машинном обучении имеют разную эффективность в зависимости от набора данных, переданных им для обучения.

Итак, модель машинного обучения пытается найти закономерности в заданном наборе данных и предсказывает результат в соответствии с шаблоном, сформированным машиной. Это довольно интуитивно понятно, поскольку человеческий мозг работает точно так же.

Теперь, поскольку студенты были обучены вопросам определенного типа, нельзя ожидать, что они будут решать вопросы по новым понятиям самостоятельно. Точно так же модель машинного обучения, обученная на определенном наборе данных, будет прогнозировать выходные данные в той же области, и нельзя ожидать, что она будет работать хорошо для другого набора данных.

Еще одним классическим примером машинного обучения будет модель «рост и возраст» человека. Например, я измерил рост 100 студентов в возрасте от 6 до 20 лет. Я вижу, что по мере увеличения возраста с 6 до 20 рост также увеличивался. Так что я обнаружил положительную корреляцию между возрастом и ростом.

Предположим, рост 11-летнего 120 см, 13-летнего 130 см и 14-летнего 135 см. Итак, если вам нужно предсказать рост 12-летнего ребенка, каков будет ваш ответ?

125 см. Правильно?

Потому что вы узнали закономерность, что с увеличением возраста на 1 год рост увеличивается на 5 см.

Это то, что делает модель машинного обучения. Согласно заданному набору данных (возраст 100 учеников и их соответствующий рост) наша модель машинного обучения может предсказать рост 12-летнего ребенка.

Теперь в приведенной выше обученной модели, если вы введете вес (вместо возраста), сможет ли машина угадать рост человека?

Без прав? Потому что модель обучалась на возраст и соответствующий рост, а не на вес и возраст.

Элементарное машинное обучение можно разделить на две части: регрессию и классификацию.

Регрессия прогнозирует значение для заданного вывода (например, вы предсказали рост 12-летнего человека).

Классификация с точки зрения непрофессионала - да или нет.

Чтобы понять классификацию, давайте возьмем пример.

Предположим, я иду в супермаркет и спрашиваю у всех присутствующих там людей — детей, подростков, взрослых — любят ли они смотреть мультики или нет, а также отмечаю их возраст. Итак, я готовлю набор данных для людей разных возрастных групп и независимо от того, любят ли они смотреть мультфильмы или нет.

Из 50 детей (в возрасте 4–12 лет) 49 сказали «да»; из 50 подростков (13–19 лет) 45 сказали «да»; и из 100 взрослых (в возрасте > 19 лет) только 15 сказали «да». Так что, если мы внимательно понаблюдаем, я могу сказать, что если я спрошу другого ребенка, любит он мультики или нет, есть большая вероятность, что он ответит «да», и если я задам тот же вопрос взрослому в другом супермаркете, он, скорее всего, ответит «да». сказать нет.

Точно так же, если мы создадим модель машинного обучения для прогнозирования того, понравится ли человеку определенного возраста мультфильм или нет, мы просто скормим подготовленный набор данных о людях и их предпочтениях модели, и она сможет предсказать, понравится ли человеку мультфильм или нет. нет.