Введение

Рост Интернета за счет социальных сетей, таких как Facebook, Twitter, Linkedin, Instagram и т. Д., Привел к значительному взаимодействию пользователей и дал им возможность выражать свое мнение о продуктах, услугах, событиях, своих предпочтениях среди прочего. Это также предоставило пользователям возможность поделиться своей мудростью и опытом друг с другом. Более быстрое развитие социальных сетей вызывает взрывной рост цифрового контента. Он превратил онлайн-мнения, блоги, твиты и посты в очень ценный актив, позволяющий корпорациям получать информацию из данных и планировать свою стратегию. Бизнес-организациям необходимо обрабатывать и изучать эти настроения, чтобы исследовать данные и получать бизнес-идеи (Yadav & Vishwakarma, 2020). Традиционный подход к ручному извлечению сложных функций, определению того, какая функция является актуальной, и извлечению закономерностей из этой огромной информации, требует очень много времени и значительных человеческих усилий. Однако глубокое обучение может демонстрировать отличную производительность с помощью методов обработки естественного языка (NLP) для выполнения анализа настроений на основе этой массивной информации. Основная идея методов глубокого обучения состоит в том, чтобы идентифицировать сложные функции, извлеченные из этого огромного количества данных, без особого внешнего вмешательства с использованием глубоких нейронных сетей. Эти алгоритмы автоматически изучают новые сложные функции. Как автоматическое извлечение функций, так и доступность ресурсов очень важны при сравнении традиционного подхода к машинному обучению и методов глубокого обучения (Araque et al., 2017). Здесь цель состоит в том, чтобы классифицировать мнения и настроения, выраженные пользователями. В этой статье мы обсудим различные методы анализа настроений и несколько ансамблевых моделей для агрегирования информации из нескольких функций.

Аннотация

В глубоком обучении используются мощные алгоритмы нейронной сети, имитирующие способ обработки данных человеческим мозгом для перевода языков, распознавания речи, обнаружения объектов и принятия решений. Алгоритмы глубокого обучения способны идентифицировать и изучать закономерности как из неструктурированных, так и немаркированных данных без вмешательства человека. Методы глубокого обучения обучаются через несколько уровней представления и генерируют современные результаты прогнозирования. В последние годы методы глубокого обучения были очень успешными при проведении анализа настроений. Он обеспечивает автоматическое извлечение признаков, широкие возможности представления и лучшую производительность, чем традиционные методы, основанные на признаках. Эти давно разработанные подходы могут дать прочную основу, а их возможности прогнозирования можно использовать в сочетании с возникающими методами глубокого обучения (Preethi et al., 2017). Очень распространены два метода нейронных сетей - сверточные нейронные сети (CNN) для обработки изображений и рекуррентные нейронные сети (RNN) - для задач обработки естественного языка (NLP) (Goularas & Kamis, 2019). Глубокое обучение используется для оптимизации рекомендаций в зависимости от анализа настроений, выполненного в различных обзорах, взятых с разных сайтов социальных сетей. Проведенные эксперименты показывают, что основанный на RNN анализ настроений с глубоким обучением (RDSA) импровизирует поведение, повышая точность анализа настроений, что, в свою очередь, дает лучшие рекомендации для пользователя и, таким образом, помогает определить конкретную позицию в соответствии с требованиями потребности пользователя (Preethi et al., 2017). В этой статье мы обсудим популярные модели глубокого обучения, которые все чаще применяются в анализе настроений, включая CNN, RNN, различные ансамблевые методы. В этой статье рассказывается о различных методах анализа настроений.

Анализ настроений

Это набор методов / алгоритмов, используемых для определения настроения (положительного, отрицательного или нейтрального) данного текста. Это очень мощное приложение обработки естественного языка (NLP), которое находит применение во многих отраслях. Это относится к использованию НЛП, анализа текста, компьютерной лингвистики и биометрии для систематической идентификации, извлечения, количественной оценки и изучения различных состояний и субъективной информации. Анализ настроений иногда выходит за рамки классификации текстов, чтобы найти мнения и классифицировать их как положительные или отрицательные, желательные или нежелательные. На рисунке ниже описана архитектура классификации тональности текстов. При этом мы модифицируем предоставленные обзоры, применяя определенные фильтры, и мы используем подготовленные наборы данных, применяя параметры, и реализуем нашу предложенную модель для оценки (Ghorbani et al., 2020).

Есть три подхода к анализу настроений:

1. Методы, основанные на лексике. Их можно разделить на два типа:

а. На основе словаря - в этом подходе классификация выполняется с использованием словаря терминов, который можно найти в WordNet или SentiWordNet.

б. На основе корпуса - в этом подходе классификация выполняется на основе статистического анализа содержимого группы документов с использованием таких методов, как скрытые марковские модели (HMM), условное случайное поле (CRF), k-ближайших соседей (k-NN) среди другие.

2. Методы, основанные на машинном обучении. Их можно разделить на две группы:

а. Традиционные модели - это классические методы машинного обучения, такие как машины опорных векторов, классификатор максимальной энтропии, наивный байесовский классификатор. Входные данные этих моделей включают особенности, основанные на лексике тональности, лексические особенности, части речи, наречия и прилагательные.

б. Модели глубокого обучения - они обеспечивают более точные результаты, чем традиционные модели. Он включает такие модели, как CNN, RNN и DNN. Эти модели решают проблемы классификации на уровне документа, уровне предложения или уровне аспекта.

3. Гибридный подход. Он сочетает в себе подходы, основанные на машинном обучении и лексике. Лексика настроений играет важную роль в большинстве этих подходов. На рисунке ниже показана таксономия различных методов, включая глубокое обучение для методов анализа настроений. Анализ настроений, независимо от того, выполняется ли он с помощью глубокого обучения или традиционного машинного обучения, требует, чтобы данные текстового обучения были очищены, прежде чем они будут использоваться для вызова классификации (Dang et al., 2020).

Глубокое обучение

Глубокое обучение использует многослойный подход к скрытым слоям нейронных сетей. Традиционно в моделях машинного обучения функции идентифицируются и извлекаются либо вручную, либо с использованием методов выбора функций. Однако в случае глубокого обучения функции изучаются, извлекаются автоматически, что обеспечивает более высокую точность и производительность. На рисунке ниже показаны различия в классификации полярности настроений между двумя подходами: традиционное машинное обучение (машина опорных векторов (SVM), байесовские сети или деревья решений) и глубокое обучение. Искусственные нейронные сети и глубокое обучение в настоящее время обеспечивают лучшие решения многих проблем в области распознавания изображений и речи, а также обработки естественного языка (Ghorbani et al., 2020). На рисунке ниже показаны различия в классификации полярности настроений между двумя подходами: традиционное машинное обучение (машина опорных векторов (SVM), байесовские сети или деревья решений) и методы глубокого обучения.

Ключевые методы глубокого обучения, которые можно использовать, перечислены ниже:

Сверточные нейронные сети (CNN) - это класс глубоких нейронных сетей, наиболее часто используемых для анализа визуальных образов. Они также известны как искусственные нейронные сети, инвариантные к пространству или инвариантные к сдвигу, из-за архитектуры с разделяемыми весами и характеристик инвариантности трансляции. CNN состоит из входного и выходного слоев, а также нескольких скрытых слоев. Скрытые слои CNN обычно состоят из серии сверточных слоев, которые сворачиваются с умножением или другим скалярным произведением. Функция активации обычно представляет собой слой RELU, за которым следуют дополнительные свертки, такие как слои объединения, полностью связанные слои и слои нормализации, называемые скрытыми слоями, поскольку их входы и выходы маскируются функцией активации и окончательной сверткой. ». Ниже представлена ​​глубокая архитектура с использованием 10-слойной сверточной нейронной сети. Начиная с входных данных, эта модель состоит из трех стадий свертки со сверткой и максимальным пулом каждая, одного плоского слоя, двух полностью связанных слоев и одного слоя softmax для выходных данных (Wang & Fey, 2018).

Глубокие нейронные сети (DNN) - это искусственная нейронная сеть (ANN) с несколькими уровнями между входным и выходным уровнями. Он находит правильные математические манипуляции, чтобы превратить входные данные в выходные, будь то линейные отношения или нелинейные отношения.

Рекуррентные нейронные сети. Рекуррентные нейронные сети (RNN) - это класс искусственных нейронных сетей, в которых соединения между узлами образуют ориентированный граф во временной последовательности. Это позволяет ему демонстрировать динамическое поведение во времени. Основная функция RNN - обработка последовательной информации на основе внутренней памяти, захваченной направленными циклами. В отличие от традиционных нейронных сетей, RNN может запоминать предыдущее вычисление информации и может повторно использовать его, применяя его к следующему элементу в последовательности входных данных. Особый тип RNN - это долгая краткосрочная память (LSTM), которая способна использовать длинную память в качестве входных данных для функций активации в скрытом слое.

На приведенном выше рисунке показана архитектура архитектуры LSTM. На этом рисунке входные данные предварительно обрабатываются для изменения формы данных для матрицы внедрения, следующий слой - это LSTM, а последний слой - это полностью связанный слой для классификации текста (Dang et al., 2020).

Заключение

В этой статье мы обсудили ядро ​​моделей глубокого обучения и методы, которые можно применить для анализа тональности данных социальных сетей. Мы обсудили различные подходы к анализу настроений, включая модели на основе машинного обучения, лексики и гибридные модели. Обсуждаются архитектуры CNN, DNN и LSTM. При анализе тональности лучше сочетать методы глубокого обучения с встраиванием слов. Кроме того, эффективность алгоритмов во многом зависит от характеристик наборов данных, поэтому удобство тестирования методов глубокого обучения с большим количеством наборов данных важно для охвата большего разнообразия характеристик.

Библиография

Арак, О., Коркуэра-Платас, И., Санчес-Рада, Дж. Ф., и Иглесиас, К. А. (2017). Улучшение анализа настроений при глубоком обучении с помощью ансамблевых методов в социальных приложениях. Экспертные системы с приложениями, 77, 236–246. Https://doi.org/https://doi.org/10.1016/j.eswa.2017.02.002

Данг, Н. К., Морено-Гарсия, М. Н., и Де ла Приета, Ф. (2020). Анализ настроений на основе глубокого обучения: сравнительное исследование. Электроника, 9 (3), 483. https://doi.org/10.3390/electronics9030483

Горбани М., Бахагигхат М., Синь К. и Озен Ф. (2020). Сеть ConvLSTMConv: подход глубокого обучения для анализа настроений в облачных вычислениях. Журнал облачных вычислений, 9 (1), 16. https://doi.org/10.1186/s13677-020-00162-1

Гуларас, Д., Камис, С. (2019). Оценка методов глубокого обучения в анализе настроений на основе данных Twitter. Международная конференция по глубокому обучению и машинному обучению в новых приложениях (Deep-ML), 2019 г., 12–17. Https://doi.org/10.1109/Deep-ML.2019.00011

Прити, Г., Кришна, П. В., Обайдат, М. С., Сарита, В., и Ендури, С. (2017). Применение глубокого обучения к анализу настроений для рекомендательной системы в облаке. Международная конференция по компьютерным, информационным и телекоммуникационным системам (CITS), 2017 г., 93–97. Https://doi.org/10.1109/CITS.2017.8035341

Ван З., Фей А. М. (2018). Глубокое обучение со сверточной нейронной сетью для объективной оценки навыков в роботизированной хирургии. Международный журнал компьютерной радиологии и хирургии, 13, 1959–1970.

Ядав, А., Вишвакарма, Д. К. (2020). Анализ настроений с использованием архитектур глубокого обучения: обзор. Обзор искусственного интеллекта, 53 (6), 4335–4385. Https://doi.org/10.1007/s10462-019-09794-5