Введение

В этом уроке вы собираетесь предсказать настроение отзывов о продукте, оставленных пользователем. Вы будете работать на платформе MindsDB и использовать прогнозирующий анализ настроений с помощью NLP с использованием интеграции Hugging Face. Это выгодно для определения намерений клиентов в отношении продукта и облегчит работу продавца в понимании требований клиентов. Набор данных, используемый для этого урока, доступен здесь.

О БД Minds

С помощью MindsDB вы можете создавать, обучать, оптимизировать и развертывать свои модели машинного обучения без необходимости переключения между окнами и платформами. А чтобы получить прогнозы или предсказать настроения, просто запросите свои данные, создайте модели машинного обучения, используя существующие модели, и запустите, чтобы предсказать результаты. MindsDB использует логику таблиц ИИ, основная концепция которых заключается в том, чтобы запускать модели машинного обучения непосредственно в таблицах и делать прогнозы на основе данных.

Команды также настолько просты, что для запуска вам потребуются только базовые знания SQL. Кроме того, предварительные знания NLP обходят стороной, поскольку вы используете предварительно обученные модели с интеграцией Hugging Face с MindsDB. Это также гарантирует, что предварительное знание ML также не требуется, поскольку вы можете использовать общедоступные модели.

Зарегистрироваться / Зарегистрироваться

Во-первых, обязательно создайте учетную запись на веб-сайте MindsDB. Это обязательно, так как вы собираетесь делать все в облачном редакторе.

После подтверждения электронной почты вы попадете в этот редактор:

Файл загружен

После успешной регистрации вам необходимо загрузить файл, который вы будете использовать для обучения модели классификатора NLP (обработка естественного языка). Вам нужно нажать на значок Добавить данные на левой панели. Затем вы сможете просмотреть все различные способы интеграции Minds DB с другими базами данных. Доступны тонны интеграций, показанных здесь (в настоящее время):

Но помимо этого MindsDB также дает возможность загружать локальные файлы размером до 500 МБ. Вы будете использовать этот метод, так как он прост и удобен для начинающих. Вы попадете на эту страницу, где вы можете загрузить данные с локального компьютера и указать имя для базы данных:

Файл, который будет использоваться в этом уроке, доступен здесь. Он содержит два столбца: настроение и отзыв. Загрузите данные и загрузите их в редактор. Дайте базе данных уникальное имя и обязательно используйте знак подчеркивания (_), если хотите отделить имя файла.

Вы также можете найти больше информации об этом в документации Minds DB.

После того, как этот шаг завершен, следующим шагом будет проверка того, была ли загружена база данных успешно или нет. Для этого воспользуемся командой SQL:

ВЫБЕРИТЕ * ИЗ файлов.обзоры

Если вывод является ожидаемой таблицей, вы можете продолжить. В противном случае выполните описанные выше шаги еще раз в своем собственном темпе.

Обязательно запустите эту команду, так как это гарантирует, что

Создайте модель

Теперь вам нужно создать модель ML, которая является моделью NLP, поскольку основное внимание уделяется обзорам продуктов. Для создания модели Minds DB дала возможность использовать предварительно обученные модели, доступные в обнимающем лице (HF). Лучшее в этом то, что вы всегда можете развернуть свою модель и использовать ее здесь. Тот факт, что вы можете бегать со своей собственной моделью, показывает, насколько это фантастично. Единственная необходимость заключается в том, что модель должна быть общедоступной моделью HF, в настоящее время команда Minds DB работает над тем, чтобы частные модели HF также были исполняемыми. Подробнее об этой функции можно отследить здесь.

Код для создания модели показан ниже:

СОЗДАТЬ МОДЕЛЬ

ПРЕДСКАЗАТЬ настроение

С ИСПОЛЬЗОВАНИЕМ

двигатель = 'обнимающее лицо'

задача='классификация текста'

model_name=’mrm8488/bert-tiny-finetuned-sms-spam-detection’

input_column = «обзор»,

labels=[‘положительно’, ‘отрицательно’];

Это создает модель с именем `sentiment_classifier_1`, которая будет использоваться для прогнозирования `настроения`, и принимает на вход различные параметры, такие как движок, задача, имя модели (из общедоступной модели HF), input_column и метки обнаруженного настроения.

Чтобы проверить, будет ли работать модель из Hugging Face в Minds DB, вы можете вставить этот URL-адрес в браузер и заменить имя пользователя и название модели:

https://huggingface.co/api/models/‹ИМЯ ПОЛЬЗОВАТЕЛЯ›/‹ИМЯ_МОДЕЛИ›

URL-адрес возвращает ответ JSON с указанием особенностей модели. Если это так, он будет работать безупречно в MindsDB.

После создания модели и выполнения запроса убедитесь, что все детали идеальны. Запустив и проверив вывод запроса:

ВЫБЕРИТЕ * ИЗ моделей

ГДЕ имя=’sentiment_classifier_1’

Вы можете успешно выполнить запрос и получить необходимую информацию, после чего все готово. Вот как будет выглядеть вывод после выполнения вышеуказанного запроса:

Протестируйте его на пользовательском вводе

Теперь, когда все готово для создания модели, вам нужно запустить модель, чтобы проверить, насколько хорошо она работает с пользовательскими входными данными. Поэтому давайте рассмотрим случайный комментарий к любому продукту с Amazon, скопируем отзывы (положительные и отрицательные) о продукте и сохраним их в базе данных.

Команда, которую вы запускаете, используется для определения тональности нескольких отзывов, полученных с Amazon. Вы можете увидеть уровень производительности модели и при желании настроить ее. Вы можете обратиться к этому примеру, если чувствуете, что застряли между ними или хотите понять с точки зрения разработчика.

Заключение

Наш мотив найти мнение (как положительное, так и отрицательное) отзывов является успешным, и благодаря этому вы можете определить доступность конкретного продукта среди покупателей и то, как вы, как продавец или производитель продукта, должны действовать для улучшения бизнеса.

Это один из вариантов использования Minds DB, и в целом это развивающееся сообщество с множеством идей на стадии реализации. Не стесняйтесь комментировать, если у вас есть какие-либо вопросы, и подписывайтесь на MindsDB и ставьте звезду github repo, если вам нравится работа.