Умы в компании серьезно задумываются о ценности машинного обучения (ML), поскольку они определяют, как интеллектуальные машины могут помочь нам расширить эту превосходную платформу. Сейчас отличное время для машинного обучения в Zendesk!
Краткая история машинного обучения в Zendesk
За последние четыре года мы вложили значительные средства в ML и используем его для расширения таких продуктов, как Support и Connect. Однако большой толчок к созданию продуктов на основе машинного обучения здесь начался с создания команды продуктов данных. Целью этой команды было создание идей, моделей и инфраструктуры, необходимых для создания первого крупного ML-продукта Zendesk: Satisfaction Prediction.
Обычно агенты узнают, удовлетворены ли их клиенты, при просмотре опросов об удовлетворенности клиентов, которые мы отправляем непосредственно от имени агентов. К тому времени агенты также, вероятно, будут иметь представление о том, где их клиенты находятся в спектре удовлетворенности. Но команда разработчиков данных представила мир, в котором результаты удовлетворенности можно прогнозировать - по мере развития разговоров. Вместо того чтобы оглядываться назад, чтобы увидеть, что пошло правильно, а что нет, мы увидели будущее, в котором мы могли предсказывать и, таким образом, намеренно влиять на результат взаимодействия.
Успех Satisfaction Prediction проложил путь для текущего набора продуктов на базе машинного обучения, которые мы сейчас обслуживаем в производстве:
- Прогнозирование удовлетворенности - упомянутый выше продукт, автодидактический набор моделей логистической регрессии, который абстрагирует автоматизированную систему для обнаружения, извлечения и выбора модели.
- Answer Bot - система, которая обрабатывает запросы клиентов и сопоставляет их с соответствующими статьями поддержки.
- Content Cues - новейшее дополнение к корпоративной платформе Zendesk, которое использует выходные данные модели, на которой работает Answer Bot, для определения недостающих частей в базе знаний Guide.
Машинное обучение в Zendesk продолжает развиваться
Продолжая развитие машинного обучения в Zendesk, мы начали вносить дополнения в науку о данных во всем мире, начиная с исходного города Zendesk - Копенгагена, Дания. Недавно я ездил из нашего офиса в Мельбурне в офис в Копенгагене, чтобы помочь в процессе набора персонала в новую команду по анализу данных, которую мы там растем. За мной ухаживала команда Пиратос, которая любезно предоставила мне рабочее место и хорошую компанию, а также высоко оценила знакомство. Скоро Piratos унаследует Content Cues, программа раннего доступа которой началась около года назад. Чтобы помочь с передачей, я поделился некоторыми уроками, которые мы извлекли в Мельбурне при создании продуктов машинного обучения. Следите за новостями, и я поделюсь с вами некоторыми из этих уроков.
Находясь там, мне посчастливилось встретиться с некоторыми другими очень талантливыми командами, которые делают Guide отличным продуктом, которым он является сегодня. Как следует из названия этого поста, одним из самых захватывающих аспектов поездки было стремление к применению машинного обучения в Копенгагене. Я начал ощущать эту энергию еще до того, как приехал в CPH, когда к нам обратились различные команды, желающие поговорить о магазине машинного обучения.
Беседы с поиском гидов
Первой командой, с которой мне посчастливилось встретиться, была команда Поиск гидов. Эти талантливые умы придумывают способы использования машинного обучения для решения особенно сложной проблемы: поисковые запросы по одному слову. Одна из идей - изучить дополнительные функции (помимо самого поискового запроса), связанные с профилями поиска пользователей и шаблонами для данной учетной записи. Другой подход заключается в использовании предварительно обученных или специально обученных наборов векторов слов для увеличения количества поисковых терминов путем определения соответствующих синонимов к словам в коротком поисковом запросе. Этого можно достичь, используя стандартный подход k-ближайших соседей по встроенным представлениям. Я оставлю несколько ссылок в конце сообщения, если вы хотите узнать больше о том, как обнаруживаются отношения между встроенными представлениями слов.
Разговор с GuideOps
Я также имел честь встретиться с GuideOps (разработчиками нашего продукта Guide). Операции, в целом, созрели для выбора машинного обучения, и другие крупные технологические компании успешно использовали машинное обучение для значительного повышения эффективности. Например, Facebook недавно опубликовал статью о том, как они использовали обобщенную линейную модель с синусоидальной базисной функцией для выявления глобальных регрессий ЦП. Аналогичные потребности испытывает и Zendesk, который может быть интересен операционным командам в целом. В ходе бесед с командой мы определили это как потенциальный подход к обнаружению регрессий в Zendesk.
Datadog рекламирует средства обнаружения аномалий и выбросов на основе машинного обучения для автоматического определения операционных регрессий, что говорит о ценности, которую эти виды технологий имеют в операциях. Понимание этой ценности во всей организации может помочь Zendesk достичь новых высот в эффективности. Руководство GuideOps в Копенгагене восприняло это и уже начало выдвигать другие идеи.
Один случай использования, который я нашел особенно интересным, - это проблема злонамеренного перебора кеша (также известного как аннулирование кеша). Проблема в том, что немного, как в обнаружении спама в электронной почте. Спам в больших объемах забивает наши почтовые ящики, поэтому мы теряем время, пытаясь найти настоящие электронные письма. Google использует машинное обучение, чтобы значительно уменьшить количество спама, попадающего в почтовые ящики Gmail, позволяя нам не спеша просматривать сообщения. Точно так же Zendesk предпочитает обслуживать кэшированные данные, поэтому GuideOps задает интересный вопрос: можем ли мы использовать машинное обучение для защиты от злонамеренных действий?
Сила твоя
Эти идеи сейчас являются частью продолжающихся обсуждений между командами, владеющими проектами в Копенгагене, и командой по анализу данных в Мельбурне. Однако я хотел бы воспользоваться этой возможностью, чтобы подчеркнуть следующий момент: эти идеи о том, как использовать машинное обучение не, исходят из науки о данных. И такого рода идеи не нужны. Как владельцы кода, который вы пишете, и продуктов, которые вы создаете, вы лучше всего знакомы со своей проблемной областью. Вы, вероятно, лучше всего поймете, где и как может помочь автоматизация на основе моделей. Но когда вы начнете или продолжите думать о способах внедрения машинного обучения в продукты, над которыми вы работаете, подумайте о том, чтобы расширить разговор за пределами вашей команды за счет взаимодействия с членами группы по анализу данных.
По моему опыту, наибольший успех приносит сотрудничество. И любое сотрудничество должно быть непрерывным разговором, который пробуждает идеи и вдохновение.
использованная литература
- Https://research.fb.com/publications/a-real-time-framework-for-detecting-efficiency-regressions-in-a-globally-distributed-codebase/
- Https://en.wikipedia.org/wiki/Basis_function#Fourier_basis
- Https://en.wikipedia.org/wiki/Word_embedding
- Https://www.datadoghq.com/blog/algorithmic-monitoring-datadog/
- Https://www.datadoghq.com/blog/introduction-anomaly-detection-datadog/
- Https://www.datadoghq.com/blog/algorithmic-monitoring-datadog/
- Https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm
- Https://www.kdnuggets.com/2018/03/introduction-k-nearest-neighbors.html
- Https://www.analyticsvidhya.com/blog/2018/03/introduction-k-neighbours-algorithm-clustering/