Анализ президентских выборов 2020 года с помощью анализа настроений в Twitter
В этом посте будут рассмотрены различные формы и аспекты анализа данных, визуализации, а также машинного обучения, углубившись в продукт, который я недавно разрабатывал, под названием ElectionTweetBoard (https://www.electiontweetboard.com/).
"Почему" стоит за выборами TweetBoard
Каждый проект, связанный с наукой о данных или искусственным интеллектом, нуждается в мощной движущей силе. Я разработал ElectionTweetBoard из искреннего любопытства, чтобы узнать больше о мнении широкой общественности о главных кандидатах на предстоящих президентских выборах и о том, насколько хорошо эти мнения соотносятся с освещением кандидатов в СМИ.
Поскольку Twitter является очень хорошим источником для сбора пользовательских данных в реальном времени, я решил создать автоматизированный рабочий процесс для получения твитов и последующего анализа настроений в этих твитах. С этой первоначальной отправной точки продукт расширился и теперь включает раздел «Быстрые ссылки», который автоматически отбирает наиболее релевантные статьи по каждому из кандидатов.
Визуализация данных распределения настроений с помощью карт кандидатов
Первый важный компонент приборной панели сайта, который выделяется, - это отдельные карточки кандидатов, которые резюмируют текущее распределение настроений, поднятых из текущего набора твитов. Зеленые, синие и красные кружки представляют собой процентное соотношение положительных, нейтральных и отрицательных значений соответственно.
Главное здесь - сделать так, чтобы цвета, представляющие каждую категорию настроений, имели четкое значение. Зеленый и красный были очевидным выбором из-за их присутствия в сообщениях об успехе и ошибках, а также в обычных устройствах, таких как светофоры. С другой стороны, голубой - это скорее нейтральный цвет с его низким уровнем общей насыщенности. Я старался поддерживать этот спектр цветовой схемы во всем приложении.
На каждой карточке кандидата также есть две кнопки, ведущие к двум отдельным всплывающим модальным окнам. Модальное окно «Информация о твитах» предназначено для отображения результатов текущего анализа настроения твитов как в качественном, так и в количественном отношении, в то время как модальное окно «Быстрые ссылки» выбирает наиболее релевантные ссылки для каждого кандидата. Давайте рассмотрим эти два компонента более подробно ниже:
Твиты Модальные
Модальное окно твитов состоит из трех разделов, каждый из которых посвящен отображению определенных категорий данных:
- Образцы твитов
- Настроения с течением времени
- Мнения по географии
Качественный анализ данных с помощью образцов твитов
На вкладке «Образцы твитов» мода твитов отображаются образцы как последних положительных, так и отрицательных твитов, которые были добавлены для каждого из кандидатов. Цель этого - дать пользователям возможность лучше понять, что люди говорят о конкретных кандидатах в определенные моменты времени.
Визуализация данных временных рядов с помощью настроений во времени
Теперь, в то время как вкладка «Образцы твитов» предназначена для предоставления наиболее актуальных качественных данных в реальном времени, вкладка «Настроения с течением времени» детализируется и отображает тенденции для различных категорий настроений за разные периоды времени. Такой анализ обычно называют анализом временных рядов.
Комбинируя вышеупомянутый качественный анализ данных с помощью выборочных твитов с анализом настроений временных рядов, описанным выше, можно начать лучше понимать, как определенные события / решения могут быть связаны с общественными настроениями.
Визуализация географических данных через географическое восприятие
Мнения по географии, третий и последний раздел модального окна твитов, посвящен анализу настроений на основе состояния. В настоящее время цветовое кодирование основано на процентном соотношении положительных или нейтральных настроений, выраженных твитами из каждого данного состояния.
Отправная точка для дальнейших исследований
Основная цель ElectionTweetBoard - повысить осведомленность в режиме реального времени о последних событиях, происходящих в ходе выборов, через призму общественного мнения, однако она также служит ценной отправной точкой для дальнейшего изучения через раздел быстрых ссылок.
Quicks Links - это агрегатор новостей в реальном времени, который предупреждает пользователей о последних и наиболее актуальных новостных статьях, видео и фотографиях, основанных на мнениях широкой публики.
Сортировка по множеству показателей
ElectionTweetBoard также предлагает удобный раскрывающийся список для сортировки кандидатов по различным показателям. В настоящее время карточки кандидатов могут быть отсортированы на основе положительных, нейтральных и отрицательных настроений, что позволяет пользователям выбирать конкретный порядок, на котором они хотят сосредоточить свой анализ. Это также эффективный способ предоставить альтернативы стандартному, готовому к использованию упорядочиванию, которое пользователи видят при первом входе на сайт.
Вывод
Скоро начнутся кокусы и кампании накаляются, и сейчас самое подходящее время, чтобы посетить ElectionTweetBoard @ https://www.electiontweetboard.com/. Это должно помочь вам оставаться в курсе последних событий и дополнительно анализировать их с помощью функций науки о данных и машинного обучения, о которых говорилось выше!
Соответствующие ссылки
Ссылка на ElectionTweetBoard: https://www.electiontweetboard.com/