Время для искусственного интеллекта: типы машинного обучения - что происходит за кулисами, показано с примерами…

Наши решения на основе искусственного интеллекта увеличат ваш доход, сократят путь клиента к конверсии и повысят общий уровень удовлетворенности клиентов.

Все это заключено в предлагаемых нами автоматизированных маркетинговых процессах. Так почему бы не сесть за чашечку кофе и не узнать, как работают наши продукты. Давайте погрузимся в машинное обучение!

Давайте начнем с напоминания об определении машинного обучения.

Как сказал Том М. Митчелл, профессор Университета Карнеги-Меллона, машинное обучение - это «компьютерная программа, как говорят, учится на опыте E в отношении некоторого класса задач T и измеряет эффективность P, если ее производительность при выполнении задач in T, измеряемый P, улучшается с опытом E. "

Другими словами, программа выполняет задачу (T),
играет ли она в шахматы, распознает речь или идентифицирует котят на картинке. Делая это, он набирается опыта (E). Чтобы узнать, насколько хорошо программа выполняет свою задачу, мы используем показатель производительности (P), вероятность выигрыша в шахматной партии, количество правильно распознанных слов или идентифицированных котят.

Другими словами, программа учится выполнять свою задачу, и мы измеряем, насколько хорошо она выполняется, с помощью определенных показателей.

Типы машинного обучения:

Можно выделить 3 типа машинного обучения:

1. Обучение с учителем
2. Обучение без учителя
3. Обучение с подкреплением

Давайте подробнее разберемся, в чем разница между ними.

1. Обучение с учителем

Обучение с учителем можно сравнить с обучением с учителем. Когда ученик выполняет задание, учитель судит о том, насколько хорошо оно выполнено. Чтобы алгоритм обучался под наблюдением, требуется помеченный набор данных. Это означает, что набор данных содержит ответы на задачу, которую будет выполнять программа. Сначала алгоритм будет обучаться на части набора данных, изучая функции, связанные с тегами. Затем в тестовой части набора данных мы измерим его производительность при прогнозировании значений.

Обучение с учителем в основном используется в двух областях: задачах классификации и регрессии. Если алгоритм используется для задачи классификации, мы ожидаем, что на выходе будет дискретное значение, при котором входные данные будут отнесены к группе или классу. Однако, если он используется для задачи регрессии, непрерывный вход отображается на непрерывный выход.

Где Synerise использует контролируемое обучение?

Мы используем контролируемое обучение в нашем решении Churn Analytics. Анализ оттока - очень полезный инструмент, описанный в другом нашем блоге. Он работает на основе списка функций клиента, таких как количество дней с момента первой транзакции, общая сумма транзакции, дни между транзакциями и метки: отозвался ли клиент или нет, и если да, то когда? Обучаясь на основе меток и присваивая важность функциям, модели способны учиться предсказывать вероятность ухода данного клиента в заданный период времени.

Наши модели способны определять важность функций. Основываясь на поведении клиентов, мы можем предсказать, какие функции имеют большее влияние на потенциал оттока клиентов, основываясь на рассчитанном значении SHAP. С другой стороны, когортный анализ позволяет нам прогнозировать вероятность ухода клиента в каждый период времени на основе его или ее действий или их отсутствия.

Как мы можем контролировать эффективность модели контролируемого обучения?

Один из способов управления регрессионной моделью - вычисление среднеквадратичной ошибки. Для его расчета воспользуемся следующей формулой:

Для управления классификационной моделью мы используем матрицу неточностей, она показана ниже:

На основе матрицы неточностей мы можем рассчитать меры:

- количество правильно классифицированных наблюдений.
При использовании этой меры нужно соблюдать осторожность. Если один класс намного больше другого, у нас может возникнуть ложное ощущение, что наша модель работает хорошо.

- показатель, показывающий, насколько хорошо наша модель предотвращает ложноотрицательные прогнозы. Также известен как Чувствительность или Напоминание.

- это показатель, показывающий, насколько хорошо разработанная модель предотвращает ложноположительные прогнозы. Также известен как Специфичность или Избирательность.

также называемый частотой ложных тревог, позволяет нам узнать, как часто мы классифицируем наблюдение как положительное, когда на самом деле оно отрицательное.

измеряет, сколько классификаций, которые модель «считает» верными, действительно верны. Также известен как Положительное прогнозируемое значение.

представляет собой гармоническое среднее значение точности и отзыва. Принимает значения от 0 (худшее значение) до 1 (идеальная точность и отзыв).

Если выходом классификатора является числовая вероятность, а не метки классов, тогда мы можем использовать Log-Loss. Это мера точности с учетом вероятностной уверенности. Цель модели - минимизировать эту метрику, и она принимает значения от 0 до 1.

Математическая формула для задачи бинарной классификации приведена ниже:

где:

y - бинарный индикатор того, является ли метка класса правильной классификацией.
p - прогнозируемая моделью вероятность того, что i-е наблюдение относится к прогнозируемому классу.

Также возможно построить график производительности моделей машинного обучения.

Первый пример такого графика - кривая PR. Это кривая между точностью и отзывом для различных пороговых значений. Лучшими моделями являются те, которые обеспечивают высокую точность и отзывчивость значений.

Другой пример полезного графика - кривая ROC. ROC означает рабочие характеристики приемника.

График представляет собой соотношение истинно положительных результатов и ложных положительных результатов.
Лучшая модель будет иметь более высокий показатель истинных положительных результатов при сохранении низкого уровня ложных положительных результатов.

В обоих случаях бывает сложно сравнивать графики.

Вот почему мы можем измерить площадь под кривой, AUC. Кривая с более высокой площадью под ней представляет лучшую модель.

2. Обучение без учителя

Обучение без учителя пригодится, когда у нас нет помеченного набора данных или мы даем алгоритму задачу, на которую даже не знаем ответа. Модель получает этот набор данных без меток или вопросов исследования и пытается найти некоторую структуру в данных самостоятельно.

Неконтролируемое обучение может использоваться для кластеризации, обнаружения аномалий и ассоциации.

Где Synerise использует обучение без учителя?

В нашей системе рекомендаций мы используем обучение без учителя. Сбор данных из широкого спектра источников, начиная от характеристик продуктов, используемых для аналогичных рекомендаций, и заканчивая данными, созданными пользователями для персонализированных рекомендаций, а также дополнительных и перекрестных продаж. Еще один пример рекомендаций, генерируемых нашей системой рекомендаций, - это персонализированные рекламные акции, в которых мы объединяем поведенческие данные клиентов с характеристиками продуктов.

Все эти функции и поведенческие данные, записанные в событиях, встроены в векторы, и модели обнаруживают сходство между продуктами ассоциаций в приобретенных товарах. Процесс не контролируется, потому что у нас нет ответа на вопрос, например, что порекомендовать клиенту, который купил продукты X и Y, но также просмотрел продукт Z. Мы зависим от структуры поиска модели в данных, которые мы его кормим.
Из-за отсутствия помеченных данных невозможно измерить производительность модели с помощью метрик, описанных для моделей контролируемого машинного обучения.

Однако мы можем измерять производительность на более высоком уровне, контролируя конверсию клиентов или доход, полученный благодаря нашим моделям. Это одна из причин, по которой A / B-тестирование является очень полезной функцией.

3. Обучение с подкреплением.

В этом типе машинного обучения есть конкретная цель. Модели пытаются найти способ достичь этой цели наиболее оптимальным способом. Целью может быть достижение определенного результата или повышение производительности по некоторой задаче, однако целевые метки не указаны.

Сначала модель совершает случайные действия. Каждый раз, когда алгоритм выполняет действие, приближающее его к цели, он получает вознаграждение. Чтобы сделать следующий шаг, он полагается на предыдущие отзывы, а также пробует новую тактику. Это также означает, что модель должна думать о долгосрочных эффектах своих действий.

Где Synerise использует обучение с подкреплением?

Мы используем обучение с подкреплением в автоматизированных A / B / X-тестах. Тесты A / B / X позволяют нам протестировать две или более версий рекомендательной кампании. Мы также можем протестировать кампании друг против друга или протестировать кампанию с контрольной группой, не участвующей в кампании.

В Synerise мы допускаем автоматизацию тестирования. Вместо того, чтобы проводить тест в течение определенного периода времени, а затем сравнивать результаты, тест автоматически увеличит процент аудитории для версии, которая конвертируется лучше.

Цель здесь - повысить конверсию, будь то доход или CTR. Создание более высоких значений этих показателей дает модели вознаграждение. В случае автоматического A / B / X-тестирования это будет означать, что модель будет отображать лучшую кампанию для все более высокого процента аудитории, состоящей из ваших клиентов.

Выводы

Существуют разные типы машинного обучения, и каждый из них является хорошим выбором в зависимости от многих факторов, например, если у нас есть помеченный набор данных или нет, если мы знаем вопрос исследования до того, как мы начнем анализ, или если мы пытаемся найти лучший способ достичь конкретной цели.

Есть способы измерить производительность каждого типа, будь то прямые или косвенные методы. Synerise подготовила для вас эти модели, которые помогут вам достичь новых ключевых показателей эффективности в вашем бизнесе. Мы надеемся, что это краткое введение в типы машинного обучения позволит вам немного лучше понять наши алгоритмы.

Первоначально опубликовано на synerise.co м 22.08.2019