ИСПОЛЬЗОВАНИЕ IBM AUTOAI ДЛЯ АНАЛИЗА ФАКТОРОВ, ВЛИЯЮЩИХ НА УРОВЕНЬ ИСПОЛЬЗОВАНИЯ ИНТЕРНЕТА В СТРАНАХ

ВАЖНОСТЬ ИСПОЛЬЗОВАНИЯ ИНТЕРНЕТА

Интернет, без сомнения, превратил мир в глобальную деревню и сместил фокус бизнеса с традиционных рынков на всемирные электронные рынки. Но было замечено, что люди используют Интернет с разной степенью использования в разных местах, даже если возможности интернет-услуг одинаково доступны в двух местах. Успех маркетинговых усилий в области электронной коммерции на онлайн-рынках зависит от пользователей Интернета на целевых рынках; поэтому анализ использования интернет-статистики с помощью машинного обучения может быть очень полезен для принятия бизнес-решений, если мы сможем указать основные факторы, влияющие на использование Интернета, чтобы можно было экстраполировать ожидаемое изменение таких факторов для расчета результирующего изменения в использовании. интернета. Итак, каковы влиятельные факторы, влияющие на использование Интернета, и может ли автоматизированное машинное обучение предсказать взаимосвязь скорости использования Интернета с этими факторами?

Наша организация провела эксперимент с ИИ с помощью IBM AutoAI Watson Studio, чтобы измерить его эффективность при проведении регрессионного анализа уровня использования Интернета и выделить ключевые факторы, влияющие на использование Интернета. С этой целью данные соответствующих параметров по странам были собраны и загружены в AutoAI.

ОБЪЯСНЕНИЕ ПАРАМЕТРОВ В НАБОРЕ ДАННЫХ

1- «Уровень использования Интернета» был рассчитан как количество пользователей Интернета на каждые 100 человек в стране. Это результирующая скорость, которая будет предсказана в эксперименте с ИИ.

[Опубликовано GapMinder.com].

2- «Индекс свободы человека», рассчитанный на основе экономической свободы, гражданских свобод и соответствующих законодательств стран. Предполагается, что Индекс свободы человека влияет на количество пользователей Интернета, поскольку предполагается, что от него зависит использование социальных сетей и Интернета.

Точно так же «Индекс свободы женщин» также был включен в наши параметры, поскольку расширение прав и возможностей женщин могло повлиять на уровень использования Интернета.

[Опубликовано Институтом Катона и Институтом Фрейзера, 2020 г.]

3- «Индекс человеческого развития», показывающий уровень жизни в различных регионах мира. Эта мера была принята во внимание, исходя из предположения, что чем выше качество жизни в регионе, тем выше вероятность использования Интернета.

[Доклад, опубликованный Программой развития ООН]

4- «Средние годы образования» с указанием уровня образования в странах. «Среднее количество лет образования» лучше подходит для оценки использования Интернета, поскольку обычный уровень грамотности является слишком базовым, чтобы выделить потенциальных пользователей Интернета.

[Опубликовано Программой развития Организации Объединенных Наций]

5- «Валовой национальный доход на душу населения (ВНД)», показывающий финансовое состояние населения стран. ВНД может быть важным показателем интернет-пользователей, потому что доступность может повлиять на количество интернет-пользователей.

[Опубликовано Программой развития Организации Объединенных Наций]

6- «Возрастная группа 00–14 лет» – количество детей в возрасте до 14 лет на 100 человек населения страны. Он представляет детей 21-го века, которые рождаются в эпоху технологий и инноваций, но зависят от своих родителей в том, что касается легкого доступа к Интернету.

«Возрастная группа 15–64» — это количество людей, попадающих в возрастную группу «15–64 года», на 100 человек населения страны. Он представляет собой настоящий активный класс интернет-пользователей, которые могут использовать его для развлечения, работы или учебы.

[Оценки мирового населения Всемирного банка]

7. Наконец, также учитывался уровень урбанизации в разных странах, поскольку обычно предполагается, что пользователей Интернета может быть больше в городах, чем в поселках и деревнях. Поэтому учитывалась численность населения в городах на 100 человек населения.

[Оценки мирового населения Всемирного банка]

ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТА ИИ

Приложение IBM AutoAI — это облачное приложение, что означает, что его не требуется загружать для проведения экспериментов с ИИ. Поскольку AutoAI выполняет автоматизированное машинное обучение, знание языка программирования также не обязательно. После выполнения простых шагов регистрации и создания проекта; платформа готова к проведению экспериментов с ИИ.

Файл данных загружается в проект и прикрепляется к эксперименту с ИИ. AutoAI определяет типы данных всех параметров в файле и запрашивает прогноз столбца. После выбора коэффициента использования Интернета в раскрывающемся списке AutoAI автоматически классифицирует эксперимент как регрессионный анализ, поскольку коэффициент использования Интернета представляет собой переменное значение в диапазоне от 0 до 100. AutoAI также выбирает подходящие регрессионные модели для применения. Нажав кнопку «Запустить эксперимент», мы попадаем на страницу производительности эксперимента с ИИ, где для получения результатов требуется всего несколько минут.

РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТА

Поскольку предполагалось, что IBM AutoAI измеряет уровень использования Интернета на основе показателей человеческого развития, демографии, образования и свободы и прогнозирует уровень использования Интернета и его связь с параметрами; AutoAI сгенерировал восемь конвейеров (по умолчанию), при этом наиболее эффективные конвейеры обнаружили сильную регрессию с несколькими параметрами (и преобразованными параметрами после автоматизированного проектирования функций) и показателем RMSE 11,30 для коэффициента использования Интернета в диапазоне от 0 до 100. Хотя в регрессионном анализе машинного обучения нет идеальной оценки RMSE, но по отношению к нашей переменной скорости использования Интернета, имеющей диапазон от 0 до 100, AutoAI оказался очень эффективным для получения очень низкой оценки RMSE, т.е. очень высокой точности прогнозирования. .

В разделе оценки воронки Анализ характеристик указал, что параметры «Индекс свободы женщин», «Возрастная группа от 15 до 64 лет» и «Страна» наименее важны для прогнозирования уровня использования Интернета.

Параметр «Страна» — это уникальный идентификатор, имеющий уникальное значение для каждой комбинации, поэтому он может не помочь в эксперименте с машинным обучением ИИ.

«Возрастная группа 15–64» наименее важна для анализа, потому что процент людей в этой возрастной группе обратно пропорционален проценту людей, попадающих в «Возрастную группу 00–14», и алгоритм машинного обучения ИИ обнаруживает что для получения точных результатов может потребоваться только один из этих двух параметров. В отличие от двух вышеупомянутых параметров, «Индекс свободы женщин» также оказался наименее важным для уровня использования Интернета.

ИЗМЕНЕНИЕ НАСТРОЕК ЭКСПЕРИМЕНТА

Поскольку настройки эксперимента IBM AutoAI очень легко настроить, мы провели серию экспериментов с ИИ, изменив настройки эксперимента с ИИ, и оценили их влияние на результаты эксперимента. Наши выводы следующие:

Во-первых, мы исключили упомянутые выше наименее важные функции страны, индекса развития женщин и возрастной группы 15–60 лет (как определено IBM AutoAI) из набора данных, сняв флажки для этих параметров в настройках эксперимента с ИИ. Эксперимент с ИИ, проведенный впоследствии, дал аналогичные результаты в регрессионном анализе. Это означает, что важность характеристик параметров, выполняемых AutoAI, заслуживает анализа.

Во-вторых, мы сняли отметку с автоматически выбранных моделей эксперимента с ИИ, провели эксперимент с ИИ с разными моделями и сравнили результаты с первоначальным экспериментом. Результат был немного менее точным, чем в эксперименте с автоматическим выполнением, что означает, что выбор модели AutoAI является быстрым, но точным при создании наиболее эффективных конвейеров.

На третьем этапе мы увеличили количество пайплайнов с 8 до 16, но результаты не улучшились, хотя скорость экспериментирования снизилась. Таким образом, AutoAI исследует и использует наиболее эффективные конвейеры даже в небольших настройках конвейеров.

В последнем эксперименте с ИИ мы изменили настройки эксперимента, уменьшив процент обучающих данных. Результаты снова были немного искажены; очевидно, потому что для AutoAI было доступно меньше данных для обучения модели в AI Experiment.

Таким образом, можно сделать вывод, что автоматический выбор модели и соответствующие настройки в AutoAI очень эффективны для поиска наилучшего маршрута эксперимента с ИИ, но настройки эксперимента можно легко изменить в соответствии с выбором или требованием в течение нескольких минут.

КЛЮЧЕВЫЕ ХАРАКТЕРИСТИКИ

Валовой национальный доход, индекс человеческого развития и факторы урбанизации были определены как ключевые факторы, влияющие на уровень использования Интернета во всех запусках эксперимента. Таким образом, оценка будущих Кривых развития и урбанизации [широкодоступная] может помочь нам в прогнозировании пользователей Интернета и может помочь в разработке планов электронного маркетинга соответственно.

ВЛИЯНИЕ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА AUTOAI

Поскольку существует сильная корреляция между количеством пользователей Интернета и структурным и экономическим развитием страны, может ли AutoAI предсказать, является ли страна развивающейся или развитой страной на основе предоставленного «уровня пользователей Интернета»? Чтобы проверить этот вывод, мы провели еще один эксперимент с ИИ в AutoAI, в котором мы указали «Страна» и «Доля пользователей Интернета», в то время как Эксперимент должен предсказать статус развития страны.

AutoAI определил параметр прогнозирования как бинарную функцию, а эксперимент AI предсказал состояние развития страны с оптимизированной точностью 90%. Таким образом, здесь следует отметить, что автоматизированное машинное обучение, выполняемое AutoAI, может использоваться для адаптации эксперимента с ИИ, получения выводов на основе результатов эксперимента и повторного тестирования полученных выводов в AutoAI, чтобы воспользоваться преимуществами машинного обучения. Учиться понимать вселенную лучше, чем раньше!!!