Можно ли доверять инструментам анализа текста и настроений для интерпретации человеческих данных?

Если вы читали мой другой блог (Важность гуманизации понимания), вы должны знать, что я не верю в искусственный интеллект как замену человеку-исследователю, но я верю в его преимущества как вспомогательной технологии. .

Для меня инструменты анализа текста и настроений ничем не отличаются. Это фантастический способ сэкономить время и ресурсы в определенных областях. Специалистам-исследователям больше не нужно переваривать массу контента из постов в социальных сетях, чтобы изучить дословные ответы и пометить их темами, темами и настроениями. Инструменты анализа текста и настроений позаботятся об этом, что позволит ускорить выполнение проекта. Однако есть предостережения относительно их использования.

Инструменты анализа текста и тональности ускоряют процесс исследования, но есть оговорки

Интерпретация контекстного качества

Вы когда-нибудь неправильно читали текст или электронное письмо или упускали из виду его контекст? Я предполагаю, что ответ «да». В конце концов, все люди! И именно по этой причине я никогда не был бы полностью уверен в том, что отказываюсь от контроля и доверяю любому аналитическому программному обеспечению интерпретировать текст и настроения. Если мы сами можем совершать ошибки, то как программное обеспечение (каким бы умным оно ни было) должно делать все правильно в 100% случаев?

Существует целый ряд областей, в которых инструменты анализа текста и тональности могут дать сбой, когда вы думаете об интерпретации текста в зависимости от контекста, в котором он используется.

Скрытые эмоции

Возьмем следующее предложение: «Отлично — я израсходовал свой лимит трафика в этом месяце!»

Хотя я могу сказать, читая это, что человек, пишущий это, вероятно, проявляет раздражение, инструменты анализа вполне могут классифицировать это как положительное. Откуда им знать, что «отлично» в данном случае на самом деле не здорово, а на самом деле является отрицательным.

Смайлики

Вы когда-нибудь задумывались о том, сколько эмодзи на вашем смартфоне? И в скольких контекстах каждый из них может быть использован? И это еще до того, как вы начнете думать об использовании смайликов вместо определенных слов в социальных сетях.

Люди постоянно ищут творческие способы сократить свои слова в твитах, чтобы уложиться в ограничение в 140 символов, и смайлики — удобный способ сделать это. Очевидно, они не думают о неудобствах, которые это причиняет текстовой аналитике.

Сложность языка

Язык сложная штука. Недавняя статья BBC — Языковые правила, которые мы знаем. но не знаем, что знаем — подчеркивает это несколькими блестящими примерами. Если вы когда-нибудь пытались объяснить английскую фразу тому, чей родной язык не английский, вы поймете, что существуют лингвистические аномалии.

Например, почему вы «в автобусе», «в каноэ», но «на круизном лайнере»? Как носитель английского языка, я произношу и понимаю эти фразы естественным образом. Неизбежно есть причина для разницы, но я не знаю, в чем она заключается, и для меня это не имеет значения… Но это важно для программного обеспечения для анализа. Без понимания нюансов всех языков анализ текста невозможен. И это огромная задача НЛП.

Качественные результаты исследования, включая сарказм. сленг и смайлики нуждаются в проверке на человеческое чутье

Постоянно растущий словарь

В прошлом месяце Оксфордский словарь английского языка выпустил новое обновление, включающее более 1000 новых статей. Поколение Z все время придумывает все больше и больше сленга (некоторые из них трудно понять даже нам, миллениалам!). В каждой области каждой страны есть свои разговорные термины, и в округах с общим языком одно и то же слово может означать разные вещи. Это делает анализ текста только с помощью технологий невероятно сложным. По крайней мере, это создает области, в которых качество анализа может отсутствовать и должно контролироваться.

Использование анализа текста и тональности на практике

Как объяснил Брандвотч, программное обеспечение для анализа настроений должно постоянно развиваться, чтобы изучать и учитывать эквивалентную эволюцию нашего языка. Для исследователя также важно иметь возможность переклассифицировать настроения, если вы не согласны с автоматическими результатами. При выборе программного обеспечения для аналитики учитывайте оба этих момента.

Хотя ясно, что программное обеспечение для анализа текста и настроений предлагает некоторые преимущества, я не готов полностью передать бразды правления и, возможно, никогда не буду. По причинам, изложенным выше, я буду продолжать проверять любой автоматический анализ до того, как начнется интерпретация и отчетность клиента.