Эта статья написана в рамках платной пробной работы в Epoch AI.

Краткое содержание

Обеспечение разнообразия в командах по продуктам и ИИ снижает предвзятость и дискриминацию и, как правило, обеспечивает более надежную и менее опасную разработку новых методологий и алгоритмов. В этой статье я исследую тенденцию гендерного распределения среди авторов на высокоуровневых конференциях по машинному обучению, чтобы оценить разнообразие в передовых командах разработчиков ИИ. Используя последние пять лет трех самых известных конференций, я обнаружил, что, хотя общее количество принятых статей значительно увеличилось с 2 609 до 6 212, относительная доля авторов-женщин увеличилась лишь умеренно с 10% до 13. % за последние пять лет. В среднем менее 12% всех авторов были идентифицированы как женщины, и более 75% всех публикаций не имеют ни одного автора-женщины, что вызывает серьезную озабоченность по поводу разнообразия в группах исследователей ИИ.

О важности разнообразия

Недавние адаптации искусственного интеллекта (ИИ) в различных областях, таких как кредитный скоринг и правоохранительные органы, показали, что определенные подгруппы населения значительно ущемлены¹. Поскольку такие алгоритмы влияют на то, будет ли человек принят в университет или остановлен полицией, существует большая потребность в прозрачности, проверке и устойчивости к предвзятости, чтобы избежать вредоносного и дискриминационного поведения. Как указано в книге Невидимые женщины: предвзятость данных в мире, созданном для мужчин², одним из наиболее эффективных способов избежать предвзятости при разработке новых продуктов и алгоритмов является создание разнообразной команды разработчиков. Такие команды лучше способны выявлять и устранять потенциальные предубеждения и этические проблемы и с большей вероятностью разрабатывают системы ИИ, доступные и инклюзивные для широкого круга пользователей. К сожалению, женщины очень мало представлены в компьютерных науках и искусственном интеллекте в целом. В этой статье я использую распределение женщин-авторов на трех крупнейших конференциях по машинному обучению в качестве индикатора разнообразия в командах, разрабатывающих инновационные системы искусственного интеллекта, чтобы выделить тенденции и предостережения относительно последних разработок и способствовать продвижению разнообразия в области искусственного интеллекта. Я сосредоточился на конференциях высокого уровня, потому что работы, публикуемые на этих конференциях, как правило, представляют собой передовые разработки в области ИИ.

Сбор и оценка данных

Я отбирал конференции по их оценке воздействия и разнообразию тем. Я предполагаю, что чем выше статус конференции, тем большее потенциальное влияние на развитие ИИ оказывают ее принятые публикации. Я выбрал следующие конференции:

  • NeurIPS: Конференция по системам обработки нейронной информации, основанная в 1987 г.
  • CVPR: Конференция по компьютерному зрению и распознаванию образов, основанная в 1983 г.
  • ICML: Международная конференция по машинному обучению, основанная в 1980 г.

В рамках этой работы я ограничил публикации предыдущими пятью годами (2018–2022 гг.) и только принятыми статьями/постерами. Поскольку в настоящее время нет общедоступной базы данных принятых статей с этих конференций, я разработал веб-скребки для сбора списка названий и авторов. Я ограничил скребки записью имени и фамилии каждого автора. Таким образом, я смог собрать в общей сложности 9 570 публикаций из NeurIPS, 7 476 из CVPR и 4 894 из ICML. Если человек участвовал в нескольких публикациях, я сохранял все упоминания этого человека в наборе данных, чтобы обеспечить согласованность.

Гендерная атрибуция

Чтобы присвоить пол каждому автору, я использовал API одной из крупнейших баз данных присваивания пола, которая содержит около 6 миллионов имен. Для каждого имени указан пол, а также точность определения пола. Из 14 902 индивидуальных имен 70,4% были классифицированы как мужские, 20,7% - как женские и 8,9% - как неизвестные. Поскольку некоторые имена (например, Андреа) можно отнести к разным полам, я сосредоточился только на именах, заявленная точность которых составляет 70 % или более, чтобы обеспечить надежность. Кроме того, я удалил все имена, которые были неизвестны API гендерной атрибуции, в результате чего для анализа было получено 2365 уникальных женских имен и 9289 уникальных мужских имен.

Анализ тенденций

Как показано на рисунке выше, общее количество авторов на каждой конференции значительно увеличилось за последние пять лет, так как было принято значительно больше статей. Количество авторов-женщин варьировалось от 200 до 1383 для всех конференций и лет. В остальной части анализа я сосредоточусь на относительном процентном соотношении полов для каждой конференции и года, чтобы устранить предвзятость взвешивания конференций на основе количества принятых статей в год.

Как показано выше, процент авторов-женщин в каждом году и на конференции колебался от 9% до 13%, при этом CVPR имеет самый высокий процент авторов-женщин. Как показывает линия тренда, выделенная синим цветом, относительная доля авторов-женщин неуклонно росла за последние пять лет, но женщины-авторы по-прежнему составляют явное меньшинство на всех трех конференциях.

Женское участие

Для более глубокого понимания я представил еще две метрики для количественной оценки участия женщин в этих публикациях: статьи, в которых есть хотя бы один автор-женщина, и статьи, первым автором которых является женщина.

Как показано выше, процент статей, написанных хотя бы одним автором-женщиной, также увеличился за последние пять лет. Тем не менее, даже в 2022 году более 73% всех публикаций написаны и разработаны исключительно авторами-мужчинами, что указывает на источник потенциальной предвзятости и низкого разнообразия в исследовательских группах.

Доля первых авторов-женщин следует за менее строгой тенденцией к росту по сравнению с процентной долей авторов-женщин и участия женщин. Здесь можно возразить, что первый автор неточно отражает вклад работы в статью, особенно в отношении крупных и совместных публикаций. Тем не менее, процентная доля первых авторов-женщин находится в том же диапазоне, что и процентная доля женщин-авторов в целом, что еще раз указывает на низкое разнообразие для всех конференций.

Обсуждение

К сожалению, разнообразие исследовательских групп на трех высокоуровневых конференциях по машинному обучению по-прежнему сильно ограничено, и большинство авторов были идентифицированы как мужчины. Тем не менее, мой анализ тенденций показывает, что за последние пять лет все больше и больше женщин вносят свой вклад в ведущие исследования ИИ.

Как указывалось выше, определение пола имен может быть шумным и неопределенным. Несмотря на то, что я установил порог точности на 70%, отдельные имена могут быть ошибочно отнесены к определенному полу и потенциально исказить анализ. Кроме того, исключение всех имен, неизвестных API гендерной атрибуции, может привести к исключению определенных подгрупп населения и потребует более подробного изучения. К сожалению, данные, собранные для этой статьи, не могут охватить весь ландшафт команд разработчиков ИИ, поскольку они исключают исследовательские группы, которые не могут или не хотят публиковать свои результаты из-за ограничений компании или данных, а также работы, которые не соответствуют правилам публикации. индивидуальных конференций. Кроме того, он исключает других влиятельных лиц, таких как рецензенты, организаторы и основные докладчики.

В будущем этот анализ может быть расширен до более широкого круга конференций по машинному обучению, сбора данных за более длительный период времени и большего количества показателей разнообразия, таких как этническая принадлежность и социально-экономический статус, чтобы обеспечить более надежные результаты и интерпретацию тенденций.

Ссылки

  1. Кэти О’Нил. Оружие математического разрушения: как большие данные увеличивают неравенство и угрожают демократии. 2016.
  2. Кэролайн Криадо-Перес. Невидимые женщины: предвзятость данных в мире, созданном для мужчин. 2019.