Умы в компании серьезно задумываются о ценности машинного обучения (ML), поскольку они определяют, как интеллектуальные машины могут помочь нам расширить эту превосходную платформу. Сейчас отличное время для машинного обучения в Zendesk!

Краткая история машинного обучения в Zendesk

За последние четыре года мы вложили значительные средства в ML и используем его для расширения таких продуктов, как Support и Connect. Однако большой толчок к созданию продуктов на основе машинного обучения здесь начался с создания команды продуктов данных. Целью этой команды было создание идей, моделей и инфраструктуры, необходимых для создания первого крупного ML-продукта Zendesk: Satisfaction Prediction.

Обычно агенты узнают, удовлетворены ли их клиенты, при просмотре опросов об удовлетворенности клиентов, которые мы отправляем непосредственно от имени агентов. К тому времени агенты также, вероятно, будут иметь представление о том, где их клиенты находятся в спектре удовлетворенности. Но команда разработчиков данных представила мир, в котором результаты удовлетворенности можно прогнозировать - по мере развития разговоров. Вместо того чтобы оглядываться назад, чтобы увидеть, что пошло правильно, а что нет, мы увидели будущее, в котором мы могли предсказывать и, таким образом, намеренно влиять на результат взаимодействия.

Успех Satisfaction Prediction проложил путь для текущего набора продуктов на базе машинного обучения, которые мы сейчас обслуживаем в производстве:

  1. Прогнозирование удовлетворенности - упомянутый выше продукт, автодидактический набор моделей логистической регрессии, который абстрагирует автоматизированную систему для обнаружения, извлечения и выбора модели.
  2. Answer Bot - система, которая обрабатывает запросы клиентов и сопоставляет их с соответствующими статьями поддержки.
  3. Content Cues - новейшее дополнение к корпоративной платформе Zendesk, которое использует выходные данные модели, на которой работает Answer Bot, для определения недостающих частей в базе знаний Guide.

Машинное обучение в Zendesk продолжает развиваться

Продолжая развитие машинного обучения в Zendesk, мы начали вносить дополнения в науку о данных во всем мире, начиная с исходного города Zendesk - Копенгагена, Дания. Недавно я ездил из нашего офиса в Мельбурне в офис в Копенгагене, чтобы помочь в процессе набора персонала в новую команду по анализу данных, которую мы там растем. За мной ухаживала команда Пиратос, которая любезно предоставила мне рабочее место и хорошую компанию, а также высоко оценила знакомство. Скоро Piratos унаследует Content Cues, программа раннего доступа которой началась около года назад. Чтобы помочь с передачей, я поделился некоторыми уроками, которые мы извлекли в Мельбурне при создании продуктов машинного обучения. Следите за новостями, и я поделюсь с вами некоторыми из этих уроков.

Находясь там, мне посчастливилось встретиться с некоторыми другими очень талантливыми командами, которые делают Guide отличным продуктом, которым он является сегодня. Как следует из названия этого поста, одним из самых захватывающих аспектов поездки было стремление к применению машинного обучения в Копенгагене. Я начал ощущать эту энергию еще до того, как приехал в CPH, когда к нам обратились различные команды, желающие поговорить о магазине машинного обучения.

Беседы с поиском гидов

Первой командой, с которой мне посчастливилось встретиться, была команда Поиск гидов. Эти талантливые умы придумывают способы использования машинного обучения для решения особенно сложной проблемы: поисковые запросы по одному слову. Одна из идей - изучить дополнительные функции (помимо самого поискового запроса), связанные с профилями поиска пользователей и шаблонами для данной учетной записи. Другой подход заключается в использовании предварительно обученных или специально обученных наборов векторов слов для увеличения количества поисковых терминов путем определения соответствующих синонимов к словам в коротком поисковом запросе. Этого можно достичь, используя стандартный подход k-ближайших соседей по встроенным представлениям. Я оставлю несколько ссылок в конце сообщения, если вы хотите узнать больше о том, как обнаруживаются отношения между встроенными представлениями слов.

Разговор с GuideOps

Я также имел честь встретиться с GuideOps (разработчиками нашего продукта Guide). Операции, в целом, созрели для выбора машинного обучения, и другие крупные технологические компании успешно использовали машинное обучение для значительного повышения эффективности. Например, Facebook недавно опубликовал статью о том, как они использовали обобщенную линейную модель с синусоидальной базисной функцией для выявления глобальных регрессий ЦП. Аналогичные потребности испытывает и Zendesk, который может быть интересен операционным командам в целом. В ходе бесед с командой мы определили это как потенциальный подход к обнаружению регрессий в Zendesk.

Datadog рекламирует средства обнаружения аномалий и выбросов на основе машинного обучения для автоматического определения операционных регрессий, что говорит о ценности, которую эти виды технологий имеют в операциях. Понимание этой ценности во всей организации может помочь Zendesk достичь новых высот в эффективности. Руководство GuideOps в Копенгагене восприняло это и уже начало выдвигать другие идеи.

Один случай использования, который я нашел особенно интересным, - это проблема злонамеренного перебора кеша (также известного как аннулирование кеша). Проблема в том, что немного, как в обнаружении спама в электронной почте. Спам в больших объемах забивает наши почтовые ящики, поэтому мы теряем время, пытаясь найти настоящие электронные письма. Google использует машинное обучение, чтобы значительно уменьшить количество спама, попадающего в почтовые ящики Gmail, позволяя нам не спеша просматривать сообщения. Точно так же Zendesk предпочитает обслуживать кэшированные данные, поэтому GuideOps задает интересный вопрос: можем ли мы использовать машинное обучение для защиты от злонамеренных действий?

Сила твоя

Эти идеи сейчас являются частью продолжающихся обсуждений между командами, владеющими проектами в Копенгагене, и командой по анализу данных в Мельбурне. Однако я хотел бы воспользоваться этой возможностью, чтобы подчеркнуть следующий момент: эти идеи о том, как использовать машинное обучение не, исходят из науки о данных. И такого рода идеи не нужны. Как владельцы кода, который вы пишете, и продуктов, которые вы создаете, вы лучше всего знакомы со своей проблемной областью. Вы, вероятно, лучше всего поймете, где и как может помочь автоматизация на основе моделей. Но когда вы начнете или продолжите думать о способах внедрения машинного обучения в продукты, над которыми вы работаете, подумайте о том, чтобы расширить разговор за пределами вашей команды за счет взаимодействия с членами группы по анализу данных.

По моему опыту, наибольший успех приносит сотрудничество. И любое сотрудничество должно быть непрерывным разговором, который пробуждает идеи и вдохновение.

использованная литература

  1. Https://research.fb.com/publications/a-real-time-framework-for-detecting-efficiency-regressions-in-a-globally-distributed-codebase/
  2. Https://en.wikipedia.org/wiki/Basis_function#Fourier_basis
  3. Https://en.wikipedia.org/wiki/Word_embedding
  4. Https://www.datadoghq.com/blog/algorithmic-monitoring-datadog/
  5. Https://www.datadoghq.com/blog/introduction-anomaly-detection-datadog/
  6. Https://www.datadoghq.com/blog/algorithmic-monitoring-datadog/
  7. Https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm
  8. Https://www.kdnuggets.com/2018/03/introduction-k-nearest-neighbors.html
  9. Https://www.analyticsvidhya.com/blog/2018/03/introduction-k-neighbours-algorithm-clustering/