Публикации по теме 'nlp'


Обработка естественного языка (NLP): расширенное руководство для начинающих (часть 13) — Лексическая обработка…
В этой многосекционной итеративной серии вы познакомитесь с лексической обработкой: токенизация. Является продолжением 12 части серии. В предыдущем разделе вы видели проблему избыточных токенов. Это приведет к неэффективной модели при создании детектора спама. Основание гарантирует, что к различным разновидностям слова, например, "теплый", "теплее", "согревающий" и "согретый", обращается лексема единственного числа - "теплый", в свете того факта, что все они обращаются к одним и..

Сравнение понимания языка в Dialogflow и NeuralSpace
Введение Продолжая наше предыдущее сравнение индийских языков на Dialogflow ES , мы в NeuralSpace расширились до большего количества языков. В этой статье мы оцениваем службы распознавания речи Google Cloud's Dialogflow ES и NeuralSpace для всех языков, для которых языковая поддержка Dialogflow пересекается с массовым набором данных Amazon , за исключением индийских языков, которые мы сравнивали в предыдущее сравнение. Мы также сравниваем языковую поддержку обеих платформ,..

Создание собственного языкового переводчика
Создание собственного языкового переводчика Ну, иногда мне кажется, что вы действительно понимаете концепцию, если можете ее реализовать (это не всегда возможно, но мы все равно можем попробовать). Так что недавно у меня была возможность поработать над нейронным машинным переводом (NMT). Для всех, кто не слышал об этом термине, есть большая вероятность, что вы все еще использовали его, когда вы вводите предложение в переводчике Google, или видите твит, переведенный на ваш язык, в..

Извлечение данных NLP: мощный инструмент для принятия военных решений
В настоящее время данные захватили военный и военный секторы, потому что тот, у кого есть точная информация в нужное время, имеет преимущество в операциях и стратегических действиях. В этой статье мы поговорим о важности данных во время войн и преимуществах пользовательских моделей обработки естественного языка при извлечении военных данных и принятии решений. I. Важность данных во время войн На протяжении всей истории господство над информацией всегда было в основе военных..

Jina Rewind ⬅️ Core получает обновление, пользовательскую фильтрацию для DocArray!
НА ЭТОЙ НЕДЕЛЕ В ДЖИНЕ Jina Rewind ⬅️ Core получает обновление, пользовательскую фильтрацию для DocArray! Новые выпуски, обновления продуктов и все, что связано с Джиной! Джина Мы рады объявить о выпуске Jina 3.6.0 со множеством новых функций, в том числе: Проверки работоспособности: теперь исполнители и каждая среда выполнения в Jina, предоставляющая сервис gRPC, придерживаются протокола проверки работоспособности gRPC . Пробный запуск на уровне потока. Чтобы..

Шаги по созданию системы распознавания речи
Шаги по созданию системы распознавания речи Создание системы распознавания речи может быть сложной задачей, состоящей из нескольких шагов. Вот общий обзор процесса: Сбор и подготовка данных для обучения. Первым шагом является сбор и подготовка данных для обучения. Это включает в себя запись звуковых образцов говорящих людей, а затем преобразование звука в текст с использованием системы транскрипции речи в текст. Затем аудио- и текстовые данные можно использовать для обучения..

Изучение текстовых данных с помощью LDA
Разберитесь в неструктурированных текстовых данных, применяя принципы машинного обучения. Введение Недавно я завершил свой первый проект по машинному обучению на работе и решил применить методы, использованные в этом проекте, в моем собственном проекте. Проект, который я завершил на работе, вращался вокруг автоматической классификации текстовых данных с использованием скрытого распределения Дирихле (LDA). LDA - это модель машинного обучения без учителя в области обработки..