Доктор HCDE 512: Международный пользовательский опыт преподает доктор Сайф Сэвидж из Вашингтонского университета. Этот курс исследует дизайн для международных и развивающихся рынков с акцентом на интеллектуальные системы. На этой неделе мы узнали о моделях машинного обучения и применили их к онлайн-кампаниям профсоюзов.

Контекст дизайна

На этой неделе перед нами стояла задача: разработать интеллектуальный интерфейс машинного обучения для профсоюза латиноамериканских рабочих, чтобы организовать онлайн-кампании против жестокого обращения с начальниками и работодателями. Модель машинного обучения учится определять, когда кампания, созданная работником, станет вирусной или нет.

Я решил двигаться вперед с латиноамериканским населением в Мексике. Ранее я оценивал их размеры Hofstede и хотел расширить свои знания в области дизайна для динамичной страны, находящейся всего в двух часах езды от моего дома. В моем посте о дизайне для МИДа подробнее о размерах здесь.

Цель состоит в том, чтобы предоставить модель машинного обучения, которая поможет будущим кампаниям прогнозировать их успех. Вирусная здесь означает, что кампания достигла необходимого количества подписей на веб-сайте, таком как change.org.

Население и оценка модели

При оценке моделей машинного обучения важно учитывать культуру. Мексика имеет высокий контекст и полихронное общество. Существует невысказанная информация через жесты и чувство группы внутри и снаружи. Поскольку время может быть гибким, они верят в долгосрочные отношения и будут уважать оперативность в близких отношениях. Это привело меня к выбору модели машинного обучения с контролируемым обучением. Для контролируемых моделей требуется, чтобы люди помогали системе создавать ярлыки. Я считаю это важным в отношении классификации изображений и языка при использовании хэштегов в социальных сетях. Это может помочь в интерпретации жестов в изображениях и языковых контекстах. Что касается полихронного аспекта, это может помочь в выборе данных, собираемых из социальных сетей, таких как корреляция времени публикации сообщений с подписанием онлайн-кампании. Размеры Хофстеде будут уточнены в модели ниже.

Модель контролируемого машинного обучения

Входящие данные

Необработанные данные, которые необходимо собрать, будут поступать с веб-сайта кампании из успешных петиций. Это будет включать даты, количество подписей, имена и профили работников для демографической информации, информации о заработной плате и образовании. Многие из этих сайтов кампании связаны с социальными сетями (Facebook, LinkedIn). Будут собираться дополнительные данные, такие как акции, хэштеги, комментарии, лайки, социальные сети и социальное положение.

Очистка данных

Этот шаг потребует удаления стоп-слов и обеспечит согласованность числовых данных, таких как даты, время и зарплата. В контролируемой модели маркировка будет производиться краудфандингом, особенно в отношении классификации изображений и языка. Предполагается, что при высоком показателе избегания неопределенности более успешные кампании будут иметь более четкий текст. Четкие слова действий и лозунги будут помечены успешными петициями. Наличие высокой дистанции власти и низкого показателя индивидуализма означает, что данные о социальном положении и влиянии также будут важным фактором маркировки. Они могут быть очень уникальными для человека, и помощь людей в процессе маркировки поможет уменьшить ошибки в прогнозировании.

Извлечение признаков

Данные кампании будут представлены в виде вектора, такого как собранные подписи, слова действий, демографические данные, социальное положение и анализ настроений по содержанию.

Вывод и цель машинного обучения

Извлекая данные из текущих успешных кампаний, модель машинного обучения сможет создавать корреляции между данными, такими как профили работников, демографические данные, фразы и формулировки кампании, а также аспекты социальных сетей (репосты, лайки), чтобы предсказать, станет ли НОВАЯ кампания вирусной. Это означало бы, что модель может предсказать, получит ли новая кампания количество подписей, необходимое для того, чтобы оказать влияние на рабочих против компании.

Метрики и оценка

Чувствительность (истинно положительная): машина правильно предсказывает, что новая кампания станет вирусной (т. е. правильно определяет кампании, которые будут успешными).

Специфичность (истинно отрицательный): машина правильно предсказывает, что кампания НЕ станет вирусной (т. е. правильно определяет кампании, которые не увенчаются успехом).

Ложное срабатывание: машина неправильно предсказывает, что кампания станет вирусной (т. е. машина говорит, что кампания станет вирусной, но это НЕ так). Возможные последствия: это может привести к тому, что сторонники, которые, возможно, были более активно вовлечены из-за предсказания успеха, будут уволены работодателем, который увидит их комментарии.

Ложноотрицательный результат: машина неправильно предсказывает, что кампания НЕ станет вирусной (т. е. машина говорит, что кампания не станет вирусной, но это не так). Возможные последствия: это может привести к тому, что некоторые коллеги преждевременно уволятся с работы, потеряв надежду из-за ложного прогноза неудачи.

Заключение

Модели машинного обучения требуют нескольких технических и культурных соображений. Как видно из Метрики и оценки, ошибки в модели могут иметь последствия, особенно для медицинских моделей. Важно учитывать этические соображения при наличии ошибок в системе при подготовке к выпуску продукта. Как новичок в области машинного обучения, я с нетерпением жду возможности глубже погрузиться в различные модели в отношении различных контекстов данных. По мере того, как я лучше разбираюсь в использовании, я надеюсь, что смогу отстаивать этические нормы как при прогнозировании, так и при сборе данных.

Примечание. Культурные аспекты в этой статье используются для классного упражнения и должны быть дополнительно проанализированы с командой локализации и послом культуры на отраслевом уровне.

Ссылки и ресурсы

https://hi.hofstede-insights.com/национальная культура

https://www.hofstede-insights.com/product/compare-countries/

https://www.dogtownmedia.com/ai-101-what-machine-learning/

https://pair.withgoogle.com/chapter/user-needs/