Affine недавно исполнилось 6 лет, я был его частью примерно 3 из них. Как аналитическая компания, мы чаще всего сталкиваемся с проблемой прогнозирования потребительского спроса. Это особенно верно для розничных клиентов и клиентов потребительских товаров.

За последние несколько лет мы столкнулись с простыми задачами прогнозирования, для которых мы можем использовать очень простые методы прогнозирования временных рядов, такие как ARIMA и ARIMAX или даже линейная регрессия это прогнозы, которые больше касаются организации или конкретных бизнес-подразделений. Но за прошедшие годы мы стали свидетелями отчетливого смещения внимания всех наших клиентов к получению прогнозов на более детальном уровне, иногда даже по конкретным позициям. Эти прогнозы трудно получить с помощью простых методов. Здесь в игру вступают более сложные техники. Эти методы представляют собой более сложные методы машинного обучения, в том числе RF, XG Boost и т. д.

Мы обслуживаем различные отраслевые области и вертикали, и чтобы объяснить, как требования клиентов изменились за эти годы, я могу привести два очень разных примера из двух специализированных областей: индустрии видеоигр и производителя и розничного продавца спортивной одежды. Ниже я попытаюсь объяснить, чем отличались бизнес-требования к прогнозу для обоих этих клиентов.

Издатель видеоигр

За последние несколько лет популярность одной франшизы, принадлежащей издателю, снизилась в силу разных факторов. Заинтересованные стороны хотели понять структуру спроса на франшизу в будущем, и им были нужны ежемесячные прогнозы продаж франшизы на следующий 1 финансовый год. Эта франшиза приносила почти 60% — 70% доходов организации, и нам требовалось прогнозировать продажи только для этой франшизы. Кроме того, поскольку это был прогноз/прогноз на уровне месяца, у нас были в основном методы черного ящика, подходящие для этого требования. достаточно точек данных, чтобы использовать анализ временных рядов или даже регрессионный анализ для прогнозирования продаж. Мы попробовали и то и другое и завершили анализ на основе регрессии, чтобы мы могли также определить движущие силы продаж и их влияние, что было важно для заинтересованных сторон.

Производитель и продавец спортивной одежды

В случае с производителем спортивной одежды и клиентом розничной торговли они хотели еженедельные прогнозы для всех стилей, доступных в их портфолио. Следовательно, клиенту требовались прогнозы для всех элементов, доступных на все недели финансового года.

Здесь много элементов, которые являются недавно выпущенными элементами, имеющими очень мало точек данных на недельном уровне. Здесь традиционная методология временных рядов потерпит неудачу из-за отсутствия точек данных, а также не все стили будут демонстрировать схожую тенденцию и сезонность. Наряду с этим будут также стили с минимальными продажами, и прогнозирование этих стилей является серьезной проблемой для этого клиента. Нам пришлось разработать ансамбль моделей, в котором мы разделили все стили на несколько ведер

  • Большой объем — большая продолжительность
  • Большой объем — низкая продолжительность
  • Низкий объем — большая продолжительность
  • Небольшой объем — небольшая продолжительностьи полностью новые запуски.

Для стилей с большим объемом и продолжительностью мы по-прежнему можем использовать временной ряд или регрессию. метод, но для всех остальных эти традиционные методы будут иметь ограничения. Следовательно, нам нужно было применить методы машинного обучениядля этих стилей.

Для стилей с низкой продолжительностью мы использовали методы случайного леса и XGB, чтобы получить прогнозы. Кроме того, для этих стилей важнее было получить правильный прогноз спроса, а не определять движущие силы продаж и их влияние, следовательно, методы ML.

Вывод

Как специалисты в области аналитики, мы понимаем, что универсального подхода к анализу данных не существует. Чтобы определить наилучший подход, необходимо иметь глубокие знания и практический опыт в различных подходах. Это было установлено в нашем недавнем опыте. В то время как требование издателя видеоигр было в первую очередь для всей франшизы, для которой мы могли бы использовать простые временные ряды и методы регрессии, требование продавца спортивной одежды было гораздо более детализированным. В другом опыте с розничным продавцом спортивной одежды прогнозы на уровне товара были основным требованием, и со временем мы, как аналитическая фирма, увидели, что это изменение в требовании от общего прогноза спроса стало слишком детальным прогнозом по всем направлениям. Кроме того, большинство наших клиентов, как правило, принимают обоснованные решения о том, сколько запасов необходимо производить и хранить для каждого товара, и детальный прогноз на уровне товара помогает в этом.

Автором данной статьи является Приянкар Сенгупта, менеджер компании Аффин.