Познакомьтесь с Синди Ван, инженером по машинному обучению в Sentropy. Синди рассказывает о своей страсти к использованию машинного обучения для обнаружения языка вражды, своей убежденности в том, что эта технология поможет решить проблему злоупотреблений в Интернете, и о процессе создания ее с нуля.

Отказ от ответственности: изображение в этом посте содержит нецензурную лексику, относящуюся к разжиганию ненависти.

Чем вы занимались до Sentropy?

Я закончил бакалавриат и магистратуру в Стэнфорде. Оба были в информатике. Так что я сложился вдвое и провел много времени в Пало-Альто! Во время учебы в бакалавриате я сосредоточился на теории, а во время учебы в магистратуре - на искусственном интеллекте. Я написал дипломную работу по обнаружению языка ненависти с помощью машинного обучения.

Чем вы занимаетесь в Sentropy?

Я инженер по машинному обучению в компании Sentropy. Как часть команды машинного обучения, мы работаем над всем, что входит в наши модели и выходит из них. Мы не только несем ответственность за построение базовой архитектуры модели, но и касаемся всех частей, которые с ней взаимодействуют. Сюда входят такие вещи, как прием данных, конвейеры данных, предварительная обработка данных, построение самих моделей и обслуживание этих моделей в производственной среде. Мы очень тесно сотрудничаем с группой обработки данных и группой обслуживания, чтобы гарантировать высокое качество наших моделей и их эффективное обслуживание.

Какую проблему решает Sentropy?

Короче говоря, наши основатели увидели эту проблему злоупотреблений в Интернете и действительно захотели исправить ее. Поэтому они собрали лучших людей, которых смогли найти, чтобы найти решение.

До Sentropy я работал над проблемами доверия и безопасности как в промышленности, так и в академических кругах, и я понял, что решения, которые есть у многих онлайн-платформ для борьбы с онлайн-злоупотреблениями, были очень элементарными. Часто это был просто список плохих слов.

Но опыт создания чего-то лучшего с технологической точки зрения существует. Когда я столкнулся с Sentropy, я быстро понял, что эта команда объединяет экспертов по T&S и машинному обучению для создания технологии, которая решит эту проблему. S о том, чтобы найти решение среди людей, которые могут его решить. Вот почему мы здесь. У нас есть группа людей, которые очень мотивированы и вкладываются в решение этой проблемы. И мы верим, что сможем построить лучшее решение, чем уже существующие.

Не могли бы вы описать аспект культуры Sentropy, с которым вы столкнулись за время работы в компании?

У нас определенно есть культура, которая ожидает и поощряет всех к совместной работе с командами и проектами в рамках всей компании. Независимо от вашей должности или звания, ваше мнение ценится. Из-за этого каждый человек имеет представление о каждой сфере бизнеса и, так сказать, разбирается во множестве разных пирогов. Вы можете увидеть многое - весь технологический стек и бизнес-аспекты. Например, я чувствую себя комфортно, делая предложение по поводу продукта или предлагаю лида команде продаж. В результате мы очень сплоченная команда.

В команде машинного обучения у нас есть множество каналов, по которым наши коллеги из разных команд могут оставлять отзывы о наших моделях. У нас есть внутренний API для всех сотрудников Sentropy, которые могут протестировать и протестировать наш продукт. Мы даже недавно создали внутренний инструмент, который предоставляет визуальные объяснения предсказаний модели для определенного фрагмента контента. Он подчеркивает, насколько сильно разные части входных данных влияют на прогнозы наших моделей.

Это позволяет людям, не входящим в группу машинного обучения, понять, что происходит с нашими моделями. Это очень помогло нашим отделам обработки данных, продуктов и коммуникаций. Они лучше понимают наши модели, а затем возвращаются к нам с вопросами, которые помогают нам улучшить технологию. Как мы можем лучше построить модель для этого определения? Какие типы данных нам не хватает?

Какую роль в Sentropy играют разнообразие, равенство и инклюзивность?

Само собой разумеется, что это одна из наших основных ценностей. Это неотъемлемая часть нашей миссии по защите людей в Интернете. Важно, чтобы в нашей команде были представлены люди, для которых мы создаем.

Что касается моего личного опыта, мне повезло, что у меня было представительство с первого дня. До Sentropy я проходил стажировку в разных компаниях, и у меня никогда не было женщины в качестве менеджера. В Sentropy я встретил Микеле, эксперта в области НЛП (обработки естественного языка) и человека, который меня вдохновил. Она действительно думает об этом проблемном пространстве и обладает высокой квалификацией, чтобы найти решение. Она также была первой женщиной-техническим директором, с которой мне довелось поработать. Это было действительно важно для меня, и это главная причина, по которой я присоединился. На тот момент вся команда машинного обучения состояла из женщин, чего я не ожидал и даже не мог надеяться в прошлом. До этого мне часто доводилось быть «символической женщиной» в комнате.

Отношение к разнообразию и вовлечению как к первоочередной цели помогает нам построить лучшую компанию и лучший продукт. Для типа компании, которую мы создаем, и типа продукта, который мы хотим выпустить в мир - это абсолютно критично.

Почему вы присоединились к Sentropy?

Причина, по которой я решил присоединиться, заключалась прежде всего в том, что наша миссия - это то, что меня очень волнует. Как лично, так и с академической и технической точки зрения. Что касается технической стороны, это то, над чем я уже много думал, проводил академические исследования и работал в других компаниях.

Но я бы не присоединился к какой-либо компании, занимающейся обнаружением злоупотреблений в Интернете. Команда, которую мы собрали, не только чрезвычайно сильна с точки зрения навыков и возможностей для решения этой проблемы, но и очень увлечена и внимательна к созданию полезных инструментов и внимательному отношению к тому, как наш продукт влияет на реальных людей. Это означает всех, от пользователей платформ, которые мы обслуживаем, до модераторов контента и тех, кто аннотирует данные, которые входят в наши модели. Я уверен, что наша команда и наш подход могут реально повлиять на то, как бороться с злоупотреблениями в Интернете.

Какую роль играет миссия Sentropy в вашей повседневной работе?

Поскольку мы пытаемся построить что-то в пространстве, для которого нет установленного сценария, мы часто проводим мозговой штурм и проектируем что-то с нуля. На протяжении всего этого процесса было ясно, что у нас здесь очень внимательная и квалифицированная группа людей, и что наша цель - прежде всего, построить правильную вещь правильным образом. С продуктами машинного обучения легко увязнуть в оптимизации, скажем, метрик верхнего уровня в игрушечном наборе данных. Вместо этого мы спрашиваем себя, от каких злоупотреблений мы сможем защитить людей от Интернета? Как мы можем наиболее эффективно улучшить работоспособность платформы? Насколько мы можем улучшить чье-то впечатление в Интернете? Вот как мы определяем успех. Будь то создание сверхточной модели или платформа, которая позволяет модераторам быть более эффективными. В конце концов, наша цель - сделать Интернет более безопасным. Как бы популярно это ни звучало, или девиз - это правда.

Мы стремимся к этой цели, потому что считаем, что существует технологическое решение проблемы ненависти и жестокого обращения в Интернете. Есть способ обнаружить и смягчить его. И мы уверены, что все дело в том решении, которое мы создали. Мы собрали группу людей с очень разноплановым и глубоким опытом и знаниями. Будь то итерация новой архитектуры с командой ML, поиск новых источников данных с командой данных или уменьшение задержки наших сервисов, есть скрытый подтекст цели более высокого уровня, который выполняется для всех в каждом из этих обсуждений.

Узнайте больше о работе Синди. Читать: