Фон

Машинное обучение и интеллектуальный анализ данных, похоже, сейчас в моде в кругах веб-технологий. Однако, оглядываясь назад, можно сказать, что в науке, стоящей за этими терминами, нет ничего нового или передового. Они существуют с 1960-х годов и использовались, чтобы доставить нас на Луну. По своей сути машинное обучение и интеллектуальный анализ данных основаны на простых статистических уравнениях, созданных для оценки больших наборов данных, чтобы находить закономерности и делать прогнозы. Что изменилось в последнее время, так это их доступность для нематематиков. Если раньше деление наборов данных на данные обучения и тестирования для выполнения сложных регрессионных или классификационных симуляций выполнялось вручную, то теперь правила автоматизации появляются с появлением таких программ, как R и Tableau. Так что же мешает вам загрузить эти программы и использовать их на своем веб-сайте? Ничего такого. Но не ждите немедленного роста продаж или конверсий. Вот почему:

Как упоминалось выше, анализ данных заключается в использовании существующего набора данных для создания модели для прогнозирования результата. Подумайте об этом на секунду. Насколько ценны прогнозы на основе исторических данных в Интернете? Ясно, что полезный для статического моделирования, например, для прогнозирования погоды или трафика, такой ретроспективный подход может быть неприменим к динамической структуре онлайн-активности. Однако это не остановило многие сайты. Фактически, в наши дни в моде инвестиции в персонализацию и сегментацию пользователей. Они больше не являются отдаленными целями на горизонте, но, поскольку электронная торговля и потребление мультимедиа продолжают становиться все более и более конкурентоспособными, ожидается, что они будут стимулировать цифровой рост сегодня и в будущем. Учтите, что интеллектуальный анализ данных позволяет вам ответить на следующие вопросы: кто вы? и что вы собираетесь делать на моем сайте? Он может предсказывать, но не может делать выводы. Возможно, лучше ответить на вопросы: кто вы? И что вы, вероятно, хотите делать на моем сайте? Первый набор вопросов основан на предположении, что веб-сайт уже существует таким образом, что пользователь может делать все, что ему заблагорассудится. На самом деле UX и дизайн подталкивают человека в определенных направлениях. Если вы не можете найти одинаковый ответ на два набора вопросов, указанных выше, возможно, ваш сайт спроектирован неправильно.

Сегментация и персонализация аудитории

Перед тем, как начать какой-либо проект машинного обучения, имеет смысл поставить несколько целей и задач высокого уровня. Это может быть так же просто, как попытаться точно ответить на несколько вопросов, упомянутых выше. Получение информации о некоторых задачах, которые пытаются выполнить ваши пользователи, может быть очень ценным. Однако, как описывает Пол Боаг из платформы электронной коммерции Shopify: Многие, похоже, считают предоставление персонализированного опыта электронной коммерции гарантией успеха, - действовать на них посредством персонализации может быть очень сложно. Но в действительности все гораздо сложнее . Простого взгляда на то, кто человек и где он ищет, может быть недостаточно, чтобы привести к заметному росту продаж. Боаг продолжает: « Неважно, порекомендуете ли вы продукты, если я занят чем-то другим. Важнее, чтобы ваш контент был своевременным и актуальным, чем персонализированным ". Своевременность и актуальность предполагает, что может быть более ценно сосредоточиться на мягких или переменных чертах, а не на жестких или статических. Например, попробуйте, как долго кто-то находится на сайте, а не является ли он офицером полиции на пенсии и энтузиастом поездов. Если, конечно, вы не продаете игрушечные поезда. Дело в том, что различный сегментированный опыт может быстро стать сложным и трудным в обслуживании.

Сара Чемберс из гиганта по A / B-тестированию VWO расширяет эту идею сложности, отмечая, что персонализация - это не тактика типа« установил и забыл ». Вы не только должны убедиться, что каждый индивидуальный опыт оптимизирован для каждого уникального пользователя, но вам также необходимо убедиться, что источники данных актуальны. В конце концов, интеллектуальный анализ данных полезен только в том случае, если ваша модель может предоставить действенную информацию для прогнозирования активности клиентов. Если набор обучающих данных не является последним, модель потенциально может больше навредить, чем помочь. Это то, с чем неоднократно сталкивался бывший инженер Facebook Утсав Каушиш. Он отмечает, как трудно поддерживать размеры выборки, необходимые для строгого количественного анализа. Его решение состоит в том, чтобы все было просто. И, несмотря на мощь машинного обучения, предполагает более личные отношения с пользователем: «бывают случаи, когда вам нужно копнуть глубже, чем возможно, с помощью запроса или регрессионной модели […] просто поговорите с людьми, которым вы хотите использовать свой продукт. ” Обращение к клиентам напрямую может быть дорогостоящим и трудоемким, но имеет то преимущество, что обеспечивает ясность. Вероятность неверной интерпретации ожиданий клиента при личном собеседовании меньше, чем при отслеживании его активности в Интернете.

Не путайте сомнения в использовании машинного обучения с предположением, что оно бесполезно. При тщательном выполнении и при наличии достаточных ресурсов решения для обработки данных, такие как цифровой таргетинг и прогнозирование активности, могут оказать сильное положительное влияние на ключевые показатели эффективности. Просто будьте осторожны, оценивая уровень усилий, необходимых, чтобы сделать это правильно. От истинного понимания намерений клиентов до оценки текущих затрат на техническое обслуживание и определения достаточно описательных входных переменных - многое может пойти не так, и ваша модель может сбиться с пути. После всех этих инвестиций вы действительно получите значительную прибыль? Может быть. Но, возможно, есть более низкие плоды, которые могут иметь такое же, если не большее, влияние на ваш бизнес.