По мере роста пользовательского спроса растет и потребность в оптимизации алгоритмов и использовании машинного обучения для масштабирования сложных наборов данных.

Instacart уникальным образом сочетает в себе розничную торговлю и электронную коммерцию. Во время глобальной пандемии все больше потребителей использовали онлайн-альтернативу стандартным покупкам продуктов. Магазины предлагают онлайн-заказы и самовывоз. Услуги доставки всегда на высоте. Мне было любопытно узнать, как команда Instacart по обработке и анализу данных адаптировала свою программу и справилась с проблемами, которые они изначально представили в 2019 году.

На основе доклада Ишанта Найера, старшего специалиста по обработке данных в Instacart, посмотрите полное видео на DSSInsider и присоединяйтесь ко мне на виртуальном мероприятии DSS Retail/Ecomm.

Что такое Инстакарт?

Instacart — компания, занимающаяся розничной торговлей и электронной коммерцией, которая предлагает услуги по доставке и самовывозу продуктов в США и Канаде. Вы можете воспользоваться услугой через их мобильное приложение или веб-сайт. Instacart работает как четырехсторонняя торговая площадка, обслуживающая клиентов, розничных продавцов, сторонние торговые площадки и покупателей. Вы можете выбрать различные продукты питания, алкоголь, медицинские и личные вещи.

Как это работает:

  1. Введите свой почтовый индекс, чтобы найти местных участвующих розничных продавцов, таких как Pulix или Safeway.
  2. Выбирайте товары и оформляйте заказ в любое время суток
  3. Покупатель идет в магазин, чтобы забрать товары для вас и доставить их к вашему порогу.

Проблемы с данными

Каталог принимает и создает все данные для элементов, доступных для клиентов. Каталог данных состоит из более чем полумиллиарда товаров от более чем 300 различных розничных продавцов в 20 000 магазинов по всей Северной Америке. Это огромный набор данных, с которым нужно работать и поддерживать чистоту каждый день. Каждый из этих предметов имеет от двадцати до тридцати различных атрибутов, например, цену, размер и местоположение. Каталог становится очень сложным масштабируемым набором данных, в котором учитываются все атрибуты. Существует две основные категории атрибутов, которые необходимо организовать. Эти данные поступают от ритейлеров, производителей потребительских товаров и сторонних агрегаторов.

Специфические атрибуты магазина: цена товара, доступность, запасы

Специфические атрибуты продукта: изображения, местоположение, вес, размер, если он продается в единицах или фунтах, информация о пищевой ценности.

Что может пойти не так? Иногда со всеми этими сложными наборами данных возникают такие проблемы, как описания продуктов, не соответствующие изображениям, отсутствие изображений или продукты в неправильных категориях.

Решения

Невозможно, чтобы кто-то сидел перед компьютером 24 часа в сутки, 7 дней в неделю, пытаясь отловить каждую ошибку. Алгоритмы необходимы для регулярного ежедневного выявления этих проблем. Для каждого атрибута товара настроено не менее 10–15 алгоритмов. Instacart также использует определенные эвристики, которые сообщают команде, в чем заключаются неточности. Команда определяет, что может быть не так, затем определяет источник достоверности данных и настраивает проверки для прохождения продуктов.

Чтобы помочь с преобразованием продукта, команда также должна убедиться, что изображения высокого качества, точно соответствуют региональным стандартам измерения, указаны в правильных единицах измерения для продажи и правильно названы с брендами. Модели обнаружения изображений разрабатываются для исправления изображений и улучшения источников достоверных данных наших розничных продавцов. Это позволит извлекать текст, названия брендов, информацию о пищевой ценности и описания продуктов из изображений. Когда это решение можно будет масштабировать, оно повысит качество наших данных и распространится на другие технологические аспекты бизнеса.

Как Instacart адаптировался к вызовам COVID

В: Как Instacart в целом адаптировался к обслуживанию своих клиентов во время COVID?

Ишант: Instacart действительно хорошо адаптировался к требованиям потребителей во времена COVID. Они подключили новых розничных продавцов, что означало добавление миллионов новых товаров в их каталог. Основное предложение Instacart заключается в том, что они позволяют розничным продавцам добавлять любой товар с любым типом информации, и они будут использовать свою систему каталогов для обработки этих товаров в соответствии с требованиями Instacart. Тяжелая часть уже позади в прошлом году, как обсуждалось в моей теме разговора выше. Отныне речь идет только о добавлении новых ритейлеров с помощью автоматизации. Из-за ограничений COVID многие люди начали использовать Instacart для своих продуктовых нужд, и Instacart быстро удовлетворил эти возросшие потребности пользователей.

В: Как лидеры могут использовать данные в качестве инструмента для решения проблем во время COVID?

Ишант: COVID изменил многие тенденции в шопинге, покупке недвижимости, стриминге и многих других отраслях. Для руководителей очень важно слушать клиентов, и данные — один из лучших ресурсов для этого. Ключевые показатели эффективности (KPI) — это набор показателей, которым руководители внимательно следуют, чтобы понять состояние своего бизнеса. Из того, что я видел до сих пор в своем профессиональном опыте в качестве Data Scientist, каждый руководитель проверяет ежедневный отчет о своих бизнес-показателях и прогнозируемых тенденциях, чтобы понять, где они находятся и что делать дальше. Во время COVID регулярно прислушиваться к своим командам аналитиков и их выводам — это одна из вещей, которую должен делать лидер, чтобы оставаться на вершине своей игры. Это помогло бы им управлять ресурсами, операциями и видеть, на чем компания должна сосредоточиться дальше. Для Instacart данные помогли понять, сколько людей им нужно будет нанять, чтобы удовлетворить растущий спрос.

Вопрос: как специалист по обработке и анализу данных, как вы заметили изменения в управлении сложными наборами данных во время COVID?

Ишант: Управление наборами данных всегда меняется и адаптируется к текущим условиям. Это их основной закон. Многие компании изменили свои стратегии, чтобы соответствовать потребностям клиентов во время COVID. Это означает, что модели и наборы данных постоянно меняются, чтобы оставаться актуальными и постоянно предоставлять то, что клиенты просят сейчас.

Вывод

COVID-19 изменил покупательское поведение, и количество онлайн-заказов значительно увеличилось за последние месяцы. Используя науку о данных, Instacart смогла масштабировать свои службы доставки и адаптироваться к растущему количеству онлайн-покупок без ущерба для качества обслуживания. Используемые в Instacart алгоритмы способны выявлять ошибки в описаниях продуктов или неправильную категоризацию продуктов в онлайн-каталоге, не позволяя командам аналитиков тратить утомительное рабочее время на ручное обнаружение ошибок и позволяя им сосредоточиться на получении ценной информации для лучшего принятия решений и существенно улучшить общее впечатление о клиенте.