Что делает «прилипчивого» клиента

Термин липкий так же, как это звучит. Кто-то, кто остается рядом и придерживается подписки в течение длительного времени. В битве за LCV (Lifetime Client Value) Цель состоит в том, чтобы заработать клиентов, которые покупают и продолжают покупать. Эта идея исходит из старой поговорки: «Лучше я буду зарабатывать 10 тысяч в неделю до конца своей жизни, чем миллион долларов один раз». Для предприятий, которые продают услуги на основе подписки, LCV и ACV (средняя стоимость клиента) — это два основных способа оценки работы бизнеса. Для целей этого проекта мы собираемся сосредоточиться на LCV.

Чтобы понять LCV, вам нужны два числа. 1. Ежемесячный доход от этого клиента (ежемесячные платежи), 2. Количество месяцев (срок владения). Это дает общую сумму денег, которую приносит клиент (общие сборы). У нас есть два варианта, чтобы увеличить LCV, увеличить ежемесячные платежи или увеличить количество месяцев, в которые клиент платит. Для целей этого проекта мы сосредоточимся на идее под названием «Изменение».

Что такое Чёрн?

Отток также известен как истощение, когда клиент «отваливается» или отменяет обслуживание. В борьбе за высокую LCV истощение — враг №1. Вот где мы находим нашу полезную цель для предсказания. Можем ли мы предсказать, основываясь на описании клиента, собираются ли они «уйти». Чтобы иметь отправную точку, которая позволит нам доказать, что наша модель лучше, чем просто угадывание среднего значения, мы используем базовый уровень. В первую очередь наша цель — предсказать один из двух исходов — прекратит ли клиент обслуживание или останется с ним. Это означает, что если для оттока установлено значение «Истина», клиент прекратит или отменит обслуживание. Если «False», клиент останется с сервисом. Сначала немного запутанно. Хотя мы можем разбить его на то, что правда — это плохо, а ложь — это хорошо!.

Подготовка данных

Наша цель — использовать набор функций или «независимых переменных», чтобы предсказать цель или «зависимую переменную». После очистки нескольких столбцов в нашем наборе данных первой задачей было отделить функции от цели. Чтобы иметь честную модель, которая может действительно предсказывать, а не просто читать между строк, мы выполняем поезд, проверку, тестовое разделение данных. Это означает, что у нас есть большой набор, который модель будет использовать для изучения входов и выходов того, как предсказывать отток. Набор, чтобы убедиться, что его можно обобщить и сравнить. Затем набор, который мы не трогаем, пока не будем готовы запустить нашу модель в последний раз.

Метрики

Мы попробуем несколько разных типов моделей, чтобы найти ту, которая дала нам «лучший» результат. В данном случае «лучший» означает наибольшую вероятность того, что прогноз, полученный моделью, будет таким же, как и в реальной жизни. Мы будем использовать 2 метрики в первую очередь для того, чтобы понять нашу модель. Во-первых, это ROC-AUC, во-вторых, это Recall.

И победителем становится…

Нам нравится быть как можно более «научными», когда мы рассматриваем проблему. Это всегда лучший способ найти самое простое решение сложной проблемы. Рассматриваемая проблема — это проблема, которую мы можем отнести к категории контролируемой классификации. Это означает, что мы можем идентифицировать нашу целевую переменную, и эта целевая переменная, которую мы пытаемся предсказать, является двоичной. Мы начнем с простейшей формы прогнозного моделирования для классификации. Логистическая регрессия, этот стиль моделирования с использованием уравнения регрессии для создания линии, которая «соответствует» вероятности функций, приводящих к определенному результату. Хотя при нормальной регрессии эта линия была бы относительно прямой. В нашем случае, поскольку у нас есть только два варианта, наша линия больше похожа на букву «S». После максимально возможного научного анализа и рассмотрения множества вариантов лучшая модель оказывается там, где мы начали. Модель логистической регрессии. Основываясь на показателе ROC-AUC, равном 84,3 %, и показателе отзыва, равном 90 %, мы нашли модель, которую можно использовать для прогнозирования с высокой вероятностью того, что клиент уйдет.

ROC-AUC — это рабочая характеристика приемника и площадь под кривой. Это мера того, как наши прогнозы будут сравниваться с фактическими результатами. Результатом являются истинные и ложноположительные, а также истинные и ложноотрицательные результаты. Это может быть чрезвычайно важным фактором, когда речь идет о сценариях жизни или смерти. Потому что обслуживание вашего сервиса у определенного провайдера — это не жизнь и не смерть. Мы просто собираемся использовать это число, чтобы показать, какая модель работает лучше всего.

Ниже приведены оценки нашей модели логистической регрессии и модели XGBoost, ее ближайшего конкурента.

Отзыв – это количество истинно положительных предсказанных исходов из общего числа предсказанных исходов. Это та оценка, которую мы ищем, когда речь идет о чем-то в сфере маркетинга. Мы хотим не потерять как можно больше людей, если мы нацелимся на группу, в которой нет риска оттока, это нормально. Основная цель — включить все, что может отменить обслуживание.

Что теперь?

Теперь, когда мы официально стали гадалками, как мы можем использовать эту силу во благо? Как мы можем использовать механизмы нашей модели, чтобы помочь формировать то, как наш бизнес обращается с нашими клиентами? Давайте рассмотрим несколько показателей постмоделирования, которые дадут нам представление о том, какие характеристики наших данных оказывают наибольшее влияние на результат. Во-первых, это «Важность перестановки». Это процесс смешивания каждой функции и повторного ввода этой функции в модель, чтобы увидеть, какое влияние она окажет на результат. Этот процесс дает нам представление о том, какие характеристики клиента будут наиболее важными или на которых мы сосредоточим свою энергию, чтобы уменьшить отток клиентов.

Из того, что мы видим выше, самой важной характеристикой является «Срок пребывания». Количество месяцев, в течение которых клиент пользуется услугой. Ну, очевидно, это важно, потому что, если они все еще в компании, они еще не ушли… Давайте посмотрим на это с другой точки зрения. Чем дольше клиент остается в компании, тем больше вероятность того, что он продолжит обслуживание. Это означает, что если мы хотим увеличить LCV клиента, сосредоточив внимание на том, чтобы иметь его в течение более длительного времени, а не на быстрой продаже, мы получим экспоненциальный результат в будущем. Это может помочь отделу продаж или отделу маркетинга перейти от быстрых сделок или исправлений к долгосрочным обязательствам.

Второй по важности характеристикой, используемой для прогнозирования оттока, является «Общая сумма начислений». Это зависит от количества месяцев использования сервиса и функции «Ежемесячные платежи». Функции «Общие расходы» — это экстраполяция идеи срока пребывания в должности. Хотя мы не совсем уверены в корреляции… Это те, кто потратил больше или меньше денег? Все, что мы знаем прямо сейчас, это то, что функция важна, мы не совсем уверены, какие части функции важны. Для этого давайте посмотрим, как взаимодействуют срок владения и ежемесячные платежи — в конце концов, именно так мы получаем общие платежи.

На этой диаграмме мы видим, что желтые квадраты имеют более высокую вероятность оттока, то есть клиентов с очень _коротким_ сроком пребывания и _высокими_ ежемесячными платежами. Затем, когда вы переходите к _длительному_ сроку владения и _низким_ ежемесячным платежам, мы видим, что вероятность уменьшается. Что мы можем сделать с этой информацией, чтобы лучше управлять нашим бизнесом, оборудованием или целями в качестве отдела продаж?

Выводы

При работе с такой прогностической моделью еще многое нужно учитывать, потому что у меня нет достаточного опыта в отношении временных рамок набора данных, целей компании, более глубоких знаний о продукте и т. д. Я не могу сделать жесткие предложения. Хотя из наших выводов мы видим, что более низкая ежемесячная оплата клиентов в сочетании с достойным сроком пребывания в должности, как правило, означает, что они будут оставаться в компании дольше. Направление стратегии всех вовлеченных сторон на стимулирование ежемесячных опционов по умеренной цене с долгосрочными обязательствами может стать способом обеспечить рост, к которому стремится компания.

Ссылка на репозиторий Github и источник набора данных

Репозиторий проекта Github

Набор данных об оттоке клиентов телекоммуникационных компаний