Анализ президентских выборов 2020 года с помощью анализа настроений в Twitter

В этом посте будут рассмотрены различные формы и аспекты анализа данных, визуализации, а также машинного обучения, углубившись в продукт, который я недавно разрабатывал, под названием ElectionTweetBoard (https://www.electiontweetboard.com/).

"Почему" стоит за выборами TweetBoard

Каждый проект, связанный с наукой о данных или искусственным интеллектом, нуждается в мощной движущей силе. Я разработал ElectionTweetBoard из искреннего любопытства, чтобы узнать больше о мнении широкой общественности о главных кандидатах на предстоящих президентских выборах и о том, насколько хорошо эти мнения соотносятся с освещением кандидатов в СМИ.

Поскольку Twitter является очень хорошим источником для сбора пользовательских данных в реальном времени, я решил создать автоматизированный рабочий процесс для получения твитов и последующего анализа настроений в этих твитах. С этой первоначальной отправной точки продукт расширился и теперь включает раздел «Быстрые ссылки», который автоматически отбирает наиболее релевантные статьи по каждому из кандидатов.

Визуализация данных распределения настроений с помощью карт кандидатов

Первый важный компонент приборной панели сайта, который выделяется, - это отдельные карточки кандидатов, которые резюмируют текущее распределение настроений, поднятых из текущего набора твитов. Зеленые, синие и красные кружки представляют собой процентное соотношение положительных, нейтральных и отрицательных значений соответственно.

Главное здесь - сделать так, чтобы цвета, представляющие каждую категорию настроений, имели четкое значение. Зеленый и красный были очевидным выбором из-за их присутствия в сообщениях об успехе и ошибках, а также в обычных устройствах, таких как светофоры. С другой стороны, голубой - это скорее нейтральный цвет с его низким уровнем общей насыщенности. Я старался поддерживать этот спектр цветовой схемы во всем приложении.

На каждой карточке кандидата также есть две кнопки, ведущие к двум отдельным всплывающим модальным окнам. Модальное окно «Информация о твитах» предназначено для отображения результатов текущего анализа настроения твитов как в качественном, так и в количественном отношении, в то время как модальное окно «Быстрые ссылки» выбирает наиболее релевантные ссылки для каждого кандидата. Давайте рассмотрим эти два компонента более подробно ниже:

Твиты Модальные

Модальное окно твитов состоит из трех разделов, каждый из которых посвящен отображению определенных категорий данных:

  • Образцы твитов
  • Настроения с течением времени
  • Мнения по географии

Качественный анализ данных с помощью образцов твитов

На вкладке «Образцы твитов» мода твитов отображаются образцы как последних положительных, так и отрицательных твитов, которые были добавлены для каждого из кандидатов. Цель этого - дать пользователям возможность лучше понять, что люди говорят о конкретных кандидатах в определенные моменты времени.

Визуализация данных временных рядов с помощью настроений во времени

Теперь, в то время как вкладка «Образцы твитов» предназначена для предоставления наиболее актуальных качественных данных в реальном времени, вкладка «Настроения с течением времени» детализируется и отображает тенденции для различных категорий настроений за разные периоды времени. Такой анализ обычно называют анализом временных рядов.

Комбинируя вышеупомянутый качественный анализ данных с помощью выборочных твитов с анализом настроений временных рядов, описанным выше, можно начать лучше понимать, как определенные события / решения могут быть связаны с общественными настроениями.

Визуализация географических данных через географическое восприятие

Мнения по географии, третий и последний раздел модального окна твитов, посвящен анализу настроений на основе состояния. В настоящее время цветовое кодирование основано на процентном соотношении положительных или нейтральных настроений, выраженных твитами из каждого данного состояния.

Отправная точка для дальнейших исследований

Основная цель ElectionTweetBoard - повысить осведомленность в режиме реального времени о последних событиях, происходящих в ходе выборов, через призму общественного мнения, однако она также служит ценной отправной точкой для дальнейшего изучения через раздел быстрых ссылок.

Quicks Links - это агрегатор новостей в реальном времени, который предупреждает пользователей о последних и наиболее актуальных новостных статьях, видео и фотографиях, основанных на мнениях широкой публики.

Сортировка по множеству показателей

ElectionTweetBoard также предлагает удобный раскрывающийся список для сортировки кандидатов по различным показателям. В настоящее время карточки кандидатов могут быть отсортированы на основе положительных, нейтральных и отрицательных настроений, что позволяет пользователям выбирать конкретный порядок, на котором они хотят сосредоточить свой анализ. Это также эффективный способ предоставить альтернативы стандартному, готовому к использованию упорядочиванию, которое пользователи видят при первом входе на сайт.

Вывод

Скоро начнутся кокусы и кампании накаляются, и сейчас самое подходящее время, чтобы посетить ElectionTweetBoard @ https://www.electiontweetboard.com/. Это должно помочь вам оставаться в курсе последних событий и дополнительно анализировать их с помощью функций науки о данных и машинного обучения, о которых говорилось выше!

Соответствующие ссылки

Ссылка на ElectionTweetBoard: https://www.electiontweetboard.com/