Чираг Махапатра

Чираг Махапатра работает в Trooly, стартапе, использующем машинное обучение для предоставления рейтингов доверия на основе данных, доступных из общедоступных источников, таких как веб-сайты, социальные сети и криминальные записи.

Доверие является основой человеческого взаимодействия. Это необходимо для торговли, политики и социальных связей. Это необходимо для интернета. За последние 20 лет у нас было три отчетливых взрыва интернет-активности, каждый из которых имел свой собственный набор проблем с доверием.

  • С 2000 по 2005 год мы были свидетелями роста электронной коммерции на таких платформах, как Ebay, Amazon и Paypal. Эти компании страдали от отмывания денег и мошенничества.
  • С 2005 по 2010 год наблюдался быстрый рост социальных сетей, таких как Facebook, Linkedin и Twitter. Эти компании столкнулись с проблемами онлайн-злоупотреблений, разжигания ненависти, поддельных учетных записей и, в последнее время, поддельного контента.
  • С 2010 года наблюдается рост таких компаний, как Uber и Airbnb, которые продвигают взаимодействие на основе равных. Эти компании сталкиваются с некоторыми из проблем, упомянутых выше, наряду с новыми проблемами, связанными с гостевым вандализмом, проституцией, сексуальными домогательствами и убийствами.

Основная цель онлайн-доверия — безопасность. Опасность онлайн-взаимодействия возрастает по мере того, как взаимодействие становится более личным. Одно из самых смертоносных нападений со стрельбой в прошлом году было совершено водителем Uber в Каламазу, штат Мичиган. Список инцидентов, приписываемых райдшеринговым компаниям, собран здесь.

Большинство ведущих компаний предприняли шаги для решения проблем доверия и безопасности. Эти шаги варьировались от установления политики, такой как страхование защиты, требующей проверки биографических данных и ручной проверки транзакций. Но самым сильным из этих инструментов, возможно, является машинное обучение, потому что невозможно вручную просмотреть все транзакции на любой конкретной платформе.

На мой взгляд, развитие машинного обучения привело к трем основным изменениям. Во-первых, компании стали более активными в отношении доверия и безопасности. На ранних этапах одноранговой экономики большинство компаний банили пользователей только после того, как они совершали неправомерные действия. Однако, когда потери от мошенничества, ущерба и возможных судебных разбирательств начали накапливаться, многие компании ввели более строгие правила, блокируя пользователей даже за подозрительные действия. Например, компания может заблокировать всех пользователей с IP-адресом из Нигерии. Этот новый уровень бдительности может привести к большому количеству ложных срабатываний или ложных срабатываний. В случаях, когда существует риск для человека или компании, можно настроить алгоритм так, чтобы он принимал больше ложных срабатываний. В других случаях, когда риск представляет собой лишь небольшую финансовую потерю (злоупотребление продвижением по службе и т. д.), компании могут согласиться с ложноотрицательными результатами. Машинное обучение позволяет нам найти правильный компромисс в зависимости от сценария.

Во-вторых, появились стартапы, создающие отраслевые модели в сфере доверия и безопасности. Раньше компании при принятии решений полагались только на свои собственные данные. Теперь они могут дополнить его внешними данными. Sift Science и Onfido — два примера таких стартапов. Эти компании работали с широким кругом клиентов в разных отраслях и смогли настроить свою собственную модель для обнаружения множества закономерностей.

Например, стартапы при обработке адреса электронной почты, предоставляющие решения для доверия, обращают внимание на такие функции, как использование заглавных букв, наличие цифр в электронном письме и использование домена электронной почты горелки. Согласно их исследованию, наличие вышеперечисленных функций в 6, 4 и 9 раз больше соответствует мошенническому пользователю. Sift Science предлагает решения в области мошенничества с платежами, захвата учетной записи и содержания, продвижения и злоупотребления учетной записью; Onfido предлагает решения для проверки личности и проверки биографических данных. Используя эти внешние решения, компании, лидирующие в экономике P2P, смогли уменьшить трения для хороших пользователей, уменьшить потери от мошенничества и повысить коэффициент конверсии, в то же время сэкономив время и деньги своим командам по борьбе с мошенничеством.

Наконец, наиболее положительное влияние ИИ было на снижение предвзятости. Исследователи показали, что люди принимают решения на основе когнитивных, социальных и личных предубеждений. Например, известно, что гости Airbnb дискриминируют гостей с «чернозвучными именами, азиатов и даже инвалидов. Эти предубеждения проникли даже в наши модели машинного обучения.

Исследование Microsoft Research показывает, что когда вы применяете метод нейронной сети под названием word2vec к статьям из новостей Google, он будет кодировать гендерные стереотипы, такие как отец:доктор::мать:медсестра и мужчина:программист::женщина: домохозяйка. Эти предубеждения, как правило, больше всего влияют на меньшинства и цветных людей. Однако, как только это смещение будет выявлено, исправить ИИ или устранить смещение алгоритма будет намного проще. В настоящее время компании предпринимают активные шаги, чтобы уменьшить предвзятость и дискриминацию на своих платформах. Наиболее ярким примером является Airbnb, которая предприняла значительные шаги для продвижения инклюзивности.

Сегодня существует большое количество общедоступных данных в виде веб-сайтов, социальных сетей, списков наблюдения, списков преступников и т. д. Однако получение информации из этих данных сопряжено с огромными трудностями. Я работал над использованием общедоступных данных для улучшения проверки личности, обнаружения злоупотреблений, проверки биографических данных и решений по проверке занятости. Это было непросто, потому что каждая платформа уникальна и у каждой свой набор проблем. Я считаю, что по мере роста нашего онлайн-взаимодействия нам необходимо инвестировать в уровень доверия, чтобы уменьшить и, надеюсь, однажды устранить плохие инциденты. Машинное обучение будет играть огромную роль в построении этого уровня.