Как создать набор текстовых данных для классификации кухонь с помощью обработки естественного языка (NLP)?

Набор данных включает ингредиенты для арабской, китайской и пакистанской кухонь.

НЛП — это область ИИ, которая позволяет компьютерам понимать, воспроизводить и обрабатывать человеческий язык.

Он стал чрезвычайно мощным в результате недавних достижений в области глубокого обучения, таких как рекурсивная нейронная сеть (RNN).

Крайне важно подчеркнуть основные элементы, которые характеризуют разные кухни.

Кроме того, эти важные факторы помогают в обучении модели машинного обучения, которая затем классифицирует тип кухни без участия человека.

Начнем с импорта необходимых пакетов Python.

Поскольку вы можете не знать все возможные пакеты для проекта в начале, пакеты обычно импортируются один за другим по мере необходимости в ходе выполнения проекта.

Однако, чтобы избежать проблем, эти пакеты должны быть импортированы в первую очередь.
Прочитайте фрейм данных как фрейм данных Pandas и распечатайте верхние записи.

Первые пять строк данных
Следует отметить, что набор данных json преобразован в кадр данных pandas.

Подробнее…