Публикации по теме 'nlp'


Обработка естественного языка — Токенизация с использованием NLTK
Введение: Токенизация — это процесс преобразования абзаца/корпуса в небольшие части. Токенизация может быть выполнена с использованием библиотеки NLTK . Используя библиотеку NLTK, мы можем разбить абзац на слова или предложения. Это означает, что весь абзац делится на предложения в случае токенизации предложений. Принимая во внимание, что абзац можно разделить на слова с помощью токенизации слов. Давайте посмотрим, как мы можем реализовать токенизацию с помощью библиотеки NLTK:..

Сравнение 10 лучших API обработки речи
Обработка речи - очень популярная область машинного обучения. Существует значительная потребность в преобразовании человеческой речи в текст и текста в речь. Это особенно важно в отношении развития самообслуживания в разных местах: магазинах, транспорте, гостиницах и т. Д. Машины заменяют все больше и больше человеческой рабочей силы, и эти машины должны иметь возможность общаться с нами, используя наш язык. Вот почему распознавание речи - перспективная и важная область искусственного..

Трансформеры 2
Внимание — это все, что вам нужно (II) — изучение кода Поскольку теоретическая часть этой статьи была рассмотрена в этом посте , в этом посте я сосредоточусь на реализации каждого компонента, упомянутого в статье Transformer. Первоначальные авторы уже опубликовали свой код реализации здесь . Тем не менее, эти почти 3000 строк кода на Python не так удобны для новичка (или, по крайней мере, не так много для человека с опытом работы в CS), как я. Keras был моей основной средой..

Краткий обзор анализа настроений
Что такое анализ настроений? Анализ настроений - это процесс использования обработки естественного языка, анализа текста и статистики для анализа настроений клиентов. Ведущие компании понимают настроения своих клиентов - что люди говорят, как они это говорят и что имеют в виду. Мнения клиентов можно найти в твитах, комментариях, обзорах или в других местах, где люди упоминают ваш бренд. Анализ настроений включает в себя понимание этих эмоций с помощью программного обеспечения, и это..

Саммит AllenNLP 2019
С момента своего первого выпуска в июне 2017 года AllenNLP стала важной библиотекой для исследований НЛП с более чем сотней научных публикаций, ссылающихся на нее, и сотнями проектов с открытым исходным кодом, зависящих от нее. Чтобы сформировать будущее библиотеки, мы организовали первый саммит AllenNLP, на который к нам присоединились люди со всей страны. Среди наших разнообразных участников были такие люди, как Масато Хагивара , который скоро станет автором первой книги,..

Основные обновления самых популярных фреймворков Data Science в 2019 году
На этот раз в прошлом году мы представили вам подробный отчет обо всех важных обновлениях для популярных фреймворков в области науки о данных (машинное обучение и глубокое обучение) за 2018 год. Разработчики этих фреймворков продолжают ускоренными темпами вводить новшества. Специалистам по обработке данных требуются более мощные инструменты, чтобы выполнять работу быстрее и эффективнее, учитывая острую нехватку навыков в области науки о данных. Идея состоит в том, что с помощью более..

Автоматическая оценка эссе: конкурс Kaggle - непрерывная реализация проекта
Часть 1: Определение проблемы, построение архитектуры и предварительные условия Пожалуйста, прочтите Часть 1 , Часть 2 и Часть 3 для полного понимания и выполнения проекта с данным Github . Давайте сначала поймем значение автоматической оценки эссе. В нашей системе образования разные учащиеся пишут эссе в рамках экзамена, и учитель ставит им оценку на основе их навыков написания эссе. Вопрос в том, можно ли это автоматизировать и в какой степени? Определение . Согласно..