Введение в машинное обучение (ML)

Искусственный интеллект (ИИ) - мощный инструмент, способный выполнять задачи более эффективно, чем люди и даже традиционные алгоритмы. ML - это подмножество AI, которое позволяет алгоритму учиться при принятии решений, что, в свою очередь, делает его более точным с течением времени.

Предупреждение машинного обучения

Для разработки этих алгоритмов требуется большой объем данных и опыт программирования. Крупные компании, такие как Amazon и Google, используют машинное обучение для своего программного обеспечения и продуктов для распознавания голоса (таких как Amazon Alexa или Speech-To-Text от Google). Youtube и Facebook используют ML в своих алгоритмах рекомендаций пользователей. Однако крупные компании - не единственные, кто может извлечь большую пользу из алгоритмов машинного обучения, поскольку у них есть множество приложений в области безопасности, обнаружения вредоносных программ, программ на основе прогнозирования и многого другого. Небольшие компании и частные лица действительно могут извлечь выгоду из этих алгоритмов, но наем инженеров-программистов, покупка достаточного объема хранилища для данных и организация данных часто бывает слишком дорогостоящей и невыполнимой. Согласно исследованию Deloitte State of AI 2020 State of AI, 83% организаций считают, что в ближайшие пару лет ИИ будет иметь решающее значение для обеспечения эффективности и охвата их бизнеса. Именно здесь ML в облаке становится очень удобным.

Предоставлено: Codenex.

Введение в облачные вычисления

Облако - это вычислительное средство, которое позволяет хранить данные и предоставлять услуги по сети. Чтобы лучше объяснить разницу между облачным сервисом и обычным сервисом, давайте посмотрим на примере Блокнота Windows и Google Диска. Если вы делаете заметку на своем компьютере с помощью Блокнота Windows, она сохраняется и сохраняется локально (на физическом жестком диске вашего компьютера). Если вы делаете заметку на Google Диске с помощью Google Docs, этот документ хранится и сохраняется виртуально (на жестком диске Google) и в Интернете (так что вы можете получить доступ к своему документу на любом компьютере, если вы войдете в свою учетную запись Google. ). Создание этого Google Doc занимает не место на вашем компьютере, а скорее в облаке. Облачные сервисы - это любые сервисы, которые хранят данные в Интернете, а не на локальном жестком диске. Примеры включают Google Drive, Amazon Web Services, Zoom и другие. (Более подробную информацию об облачных вычислениях можно найти здесь)

Разница в создании документа на локальном диске и в облаке:

Алгоритмы машинного обучения в облаке

Поскольку облако позволяет людям запускать программы с большим объемом данных, не беспокоясь о хранении данных на собственном компьютере, и поскольку облако очень доступно, пока у людей есть доступ в Интернет, многие крупные компании, такие как Google и Microsoft, предлагают алгоритмы машинного обучения на своих компьютерах. облако для людей, которые хотели бы их купить. Преимущество машинного обучения в облаке - его удобство. Небольшие предприятия или разработчики могут использовать эти облачные сервисы для использования сложных алгоритмов машинного обучения, хранения данных и организации данных для своих программных целей.

Недостатки

Но за удобство этих алгоритмов приходится платить. Во-первых, они, конечно, стоят денег. Но что более важно, они усугубляют ранее существовавшие проблемы с алгоритмами машинного обучения.

Технические проблемы

Иногда алгоритмы машинного обучения имеют технические проблемы при программировании. Например, многие врачи использовали алгоритм искусственного интеллекта, который определял, является ли поражение злокачественным или нет, путем исследования изображений биопсии. Дело в том, что алгоритмы машинного обучения учатся на данных, которые вы им предоставляете. Алгоритм изменяется и подстраивается под данные, которые вы ему предоставляете. Если раковое поражение вызывает беспокойство у врача, он поместит линейку на изображения биопсии, чтобы измерить опухоль. Однако алгоритм ML начал интерпретировать плохую опухоль только как опухоль с линейкой на изображении биопсии. Это вызывает проблему у многих врачей, которым необходимо определить, нужно ли их пациентам лечение рака или нет. Мы знаем, что когда алгоритмы машинного обучения доступны в облаке, эти алгоритмы становятся гораздо более распространенными. В отрасли, где ошибки могут быть фатальными, необходимо учитывать рост числа потенциально ошибочных алгоритмов. (Подробнее об этом случае можно прочитать здесь)

Системные проблемы

Давайте посмотрим на конкретный пример, когда алгоритмы машинного обучения могут вызывать проблемы. Алгоритмы машинного обучения, используемые в настройках прогнозирования преступности, таких как обнаружение угроз с помощью камер видеонаблюдения, прогнозирование полицейской деятельности и судебные решения, пронизаны негативным предубеждением в отношении этнических меньшинств. Это происходит из-за предвзятых данных, исходящих от системно расового общества. Согласно данным ProPublic Investigation 2016 года, данные, информирующие систему искусственного интеллекта, используемую судебными судами для прогнозирования вероятности совершения осужденным преступником большего числа преступлений, были предвзяты в отношении меньшинств. Машинное обучение принимает решения на основе данных, на которых оно обучается, а это означает, что любое смещение в данных будет отражено в выводах алгоритма. Принимая во внимание этот факт, пользователи алгоритмов машинного обучения должны знать о предвзятости алгоритма и, следовательно, не принимать решения исключительно на основе выбора алгоритма машинного обучения. Другой пример - алгоритмы машинного обучения, используемые при фильтрации заявок на вакансии. Многие из этих алгоритмов используются компаниями для фильтрации заявлений о приеме на работу, не просматривая их вручную. Многие из этих алгоритмов могут отфильтровывать кандидатов с криминальным прошлым, не позволяя корпорациям давать целостный взгляд на всех кандидатов. С развитием машинного обучения в облаке проблемные алгоритмы машинного обучения стали еще более доступными, чем раньше, а это означает, что они приводят к информированию большего числа пользователей с предвзятой информацией. Без надлежащих знаний и обучения в отношении предвзятости алгоритмов машинного обучения существующий негативный эффект, который эти алгоритмы оказывают на этнические меньшинства, будет только умножаться.

Заключение

Несмотря на многочисленные преимущества машинного обучения в облаке для небольших компаний и разработчиков, негативный эффект также весьма важен. С помощью машинного обучения в облаке небольшие организации могут не отставать по эффективности и вычислительной мощности от крупных корпораций. Но так же, как ML может использоваться не по назначению крупными корпорациями, им могут злоупотреблять и более мелкие корпорации. Некоторые могут возразить, что проблемы логических ошибок и предвзятости уже существуют во всех алгоритмах машинного обучения, однако доступность в облаке увеличивает эти ошибки и предвзятости за счет широкого использования. Однако использование мощных инструментов, которые могут изменить курс компании, не должно ограничиваться только крупными техническими гигантами. Облако может уравнять правила игры между большими и маленькими компаниями. Поэтому многие считают, что, хотя машинное обучение в облаке полезно, нашему обществу необходимо лучше распознавать ошибки и предубеждения в этих алгоритмах машинного обучения.

Существует мир, который понимает предвзятость этих алгоритмов и действует соответствующим образом, независимо от того, живем мы в этом мире или нет, это предмет споров. Тем не менее, учитывая огромные возможности алгоритмов машинного обучения, пользователи всегда должны учитывать свою способность причинить вред, прежде чем использовать их.

Дополнительные ресурсы:

ACM в UCLA Medium Статьи: ACM в UCLA - Medium

Семинары по технической этике: Серия спикеров по этике искусственного интеллекта | ACM Teach LA (uclaacm.com)

Ссылки:

Чемпион, Керри. «Признание правителя вместо рака». Menlo ML, 12 января 2020 г., menloml.com/2020/01/11/recognizing-a-ruler-instead-of-a-cancer/.

Связаться с Нитин Миттал Директор | Deloitte AI [email protected] Нити. «Обзор Deloitte: состояние искусственного интеллекта на предприятии, третье издание - пресс-релиз». Deloitte, США, 16 октября 2020 г., www2.deloitte.com/us/en/pages/about-deloitte/articles/press-releases/deloitte-survey-state-of-ai-in- the-enterprise-third-edition.html.

«Время, технологии, талант». Deloitte Insights, www2.deloitte.com/us/en/insights/focus/cognitive-technologies/cloud-machine-learning.html.

Викстра 03.20.2018, Стефани и др. «Чтобы реформировать уголовное правосудие, разработать расистский алгоритм?» Журнал Undark, 30 сентября 2019 г., undark.org/2018/03/20/criminal-justice-racist-algorithm/.