Использование метода наивного Байеса, часть 4 (машинное обучение)

Классификация языка ненависти с использованием SVM и наивного BAYES (arXiv)

Автор: Д. С Асогва, С. Я Чуквунеке, С. С Нгене, Г. Н Анигбогу

Аннотация: Распространение ненависти, ранее ограничивавшееся вербальным общением, стремительно распространилось по Интернету. Социальные сети и форумы сообщества, которые позволяют людям обсуждать и выражать свое мнение, становятся платформами для распространения сообщений ненависти. Многие страны разработали законы, чтобы избежать разжигания ненависти в Интернете. Они возлагают на компании, которые управляют социальными сетями, ответственность за то, что они не искоренили разжигание ненависти. Но по мере того, как онлайн-контент продолжает расти, растет и распространение языка ненависти. Однако ручной анализ языка ненависти на онлайн-платформах невозможен из-за огромного объема данных, поскольку это дорого и требует много времени. Таким образом, важно автоматически обрабатывать онлайн-контент пользователей, чтобы обнаруживать и удалять язык ненависти из онлайн-СМИ. Многие современные подходы страдают от проблемы интерпретируемости, что означает, что может быть трудно понять, почему системы принимают решения, которые они принимают. В этой работе были предложены некоторые решения проблемы автоматического обнаружения сообщений ненависти с использованием машины опорных векторов (SVM) и алгоритмов наивного Байеса. Это позволило достичь почти современной производительности, будучи проще и давая более легко интерпретируемые решения, чем другие методы. Эмпирическая оценка этого метода привела к точности классификации приблизительно 99 % и 50 % для SVM и NB соответственно по набору тестов. Ключевые слова: классификация; разжигание ненависти; извлечение признаков, алгоритм, контролируемое обучение

2. Положительные значения признаков Приоритетная иерархическая избыточность Устраненное дерево Дополненный наивный байесовский классификатор для иерархических пространств признаков (arXiv)

Автор: Сен Ван

Аннотация: классификатор Hierarchical Redundancy Eliminated Tree Augmented Naive Bayes (HRE-TAN) представляет собой полунаивную байесовскую модель, которая изучает тип иерархического древовидного представления признаков без избыточности для оценки распределения данных. В этой работе мы предлагаем два новых типа положительных значений признаков: приоритетную иерархическую избыточность, устраненную древовидную аугментацию, наивные байесовские классификаторы, которые фокусируются на признаках, несущих положительные значения экземпляра. Два недавно предложенных метода применяются к 28 наборам данных реальной биоинформатики, показывая лучшую прогностическую эффективность, чем обычный классификатор HRE-TAN.

Использование метода наивного Байеса, часть 4 (машинное обучение)

Вопросы по теме