Статьи по теме opennlp [java, nlp, opennlp, chunked, machine-learning]

Вопросы по теме 'opennlp'

Есть ли способ получить тему предложения с помощью OpenNLP?

Есть ли способ получить тему предложения с помощью OpenNLP? Я пытаюсь выделить самую важную часть предложения пользователя. Как правило, пользователи будут отправлять предложения в наш «движок», и мы хотим точно знать, какова основная тема этого...

9704 просмотров

java nlp opennlp

28.09.2021

Обнаружена непредвиденная аннотация при обработке последовательности имен

Я хотел пройти обучение функциональности распознавания именованных сущностей в OpenNLP. Я написал фрагмент кода в соответствии с http://opennlp.apache.org/documentation/1.5.2-incubating/manual/opennlp.html#tools.namefind Я начал с тривиального...

1244 просмотров

java opennlp

26.09.2021

Как определить PP-теги / NP-теги / VP-теги в чункере openNLP?

Я хочу посчитать количество pp / np / vp в тексте, но я не знаю, как определить PP-теги / NP-теги / VP-теги в блоке chunker openNLP? Я пробовал этот код, но он не работает. ChunkerModel cModel = new ChunkerModel(modelIn); ChunkerME chunkerME =...

377 просмотров

java opennlp chunked

02.12.2021

Встроенный Porter Stemmer в java opennlp toolkit

Как будто есть встроенные в Stemmers, такие как porter Stemmer в python nltk ( https://stackoverflow.com/a/10369407/3096792 ), Я хочу знать, есть ли встроенный Porter Stemmer в java apache opennlp, хотя в этом пакете есть интерфейс...

4149 просмотров

java machine-learning nlp porter-stemmer opennlp

09.09.2021

открытое обучение nlp с именем entity

Я обучаю модель распознавания именованных сущностей, но она неправильно определяет имена людей? мои тренировочные данные выглядят так: <START:person> Pierre Vinken <END> , 61 years old , will join the board as a nonexecutive...

561 просмотров

named-entity-recognition opennlp

06.10.2021

Почему классификатор документов OpenNLP так быстро обучается?

OpenNLP значительно уступает другим классификаторам документов, которые я тестировал, поэтому, прежде чем я откажусь от него, я решил убедиться, что поиграю со всеми наборами и ручками. Одна вещь, которая выделялась для меня, заключалась в том, что...

113 просмотров

nlp opennlp

26.11.2021

Тренер OpenNLP doccat всегда дает 1 шаблон результата

Я оцениваю OpenNLP для использования в качестве классификатора документов. У меня есть продезинфицированный учебный корпус с примерно 4К файлами примерно по 150 категориям. В документах есть много общих, в основном не относящихся к делу слов, но...

55 просмотров

nlp data-science naivebayes maxent opennlp

28.10.2021

Визуализируйте структуру дерева синтаксического анализа

Я хотел бы отобразить синтаксический анализ (теги POS) из openNLP в виде визуализации древовидной структуры. Ниже я привожу дерево синтаксического анализа из openNLP , но я не могу построить его как визуальное дерево, обычное для Синтаксический...

5045 просмотров

r nlp visualization igraph opennlp

26.03.2022

Обучение модели классификатора Opennlp

Я пытаюсь обучить модель с помощью приведенного ниже кода, но я продолжаю получать сообщение об ошибке в методе DocumentCategorizerME.train() , который говорит мне изменить factory на doccatfactory . Зачем? public void trainModel() {...

161 просмотров

java training-data opennlp

04.04.2022

Как подготовить обучающие данные для OpenNLP для токенизации токена, содержащего более одного слова?

В некоторых языках (например, вьетнамском) некоторая лексика состоит из нескольких слов. Так что некоторые токены, которые содержат более одного слова, могут быть токенизированы не только с использованием пробела. У меня есть следующий ввод:...

534 просмотров

java tokenize training-data opennlp

09.05.2022

Разрешение базовой ссылки с использованием OpenNLP

Я хочу выполнить "разрешение базовой ссылки" с помощью OpenNLP. Документация Apache ( Разрешение базовой ссылки ) не распространяется как сделать "разрешение кореференции" . У кого-нибудь есть документы/учебник, как это сделать?

5698 просмотров

nlp opennlp

14.05.2022

Инструмент анализа настроений с использованием SentiWordNet и Apache OpenNLP

Я работаю над инструментом анализа настроений, используя SentiWordNet и Apache NLP . Проблема в том, что когда я помечаю предложение с помощью библиотеки НЛП, я получаю такой результат, как Test_NNP Tweet_NNP is_VBZ ready_JJ now_RB for_IN...

878 просмотров

machine-learning nlp sentiment-analysis opennlp

24.05.2022

Запрос тегов части речи с Lucene 7 OpenNLP

Для развлечения и обучения я пытаюсь создать теггер части речи (POS) с OpenNLP и Lucene 7.4. Цель состоит в том, чтобы после индексации я мог действительно искать последовательность тегов POS и находить все предложения, соответствующие...

482 просмотров

nlp lucene part-of-speech opennlp

21.05.2022

Как добавить функцию POS-тега в инструмент распознавания именованных объектов OpenNLP

Я пытаюсь настроить OpenNLP NameFinder в проекте с функцией тега части речи. Я расширил свой класс объектов из FeatureGeneratorAdapter и переопределил следующий метод. К сожалению, этот метод принимает в качестве параметра только необработанные...

418 просмотров

named-entity-recognition opennlp

06.06.2022

RMarkdown Shiny падает при рендеринге графика ggplot

Я пытаюсь создать интерактивный файл уценки с помощью Shiny, и у меня возникают проблемы с использованием ggplot с библиотеками, использующими rJava. Использование rJava не вызывает проблем. Мне пришлось использовать openNLP для некоторых операций...

339 просмотров

r ggplot2 r-markdown shiny opennlp

15.06.2022

Почему OpenNLP POSTaggerME такой медленный?

Этот вопрос задавался здесь дважды и не получил никакого ответа. Постараюсь быть более информативным. Проблема: я решил переписать POS-тегер на Java, думая, что он должен быть намного быстрее, чем POS-теггер, который я написал на Python. Для...

898 просмотров

java performance pos-tagger opennlp

27.06.2022

Обучение пользовательской модели opennlp

Привет, вы уже ссылались на это , это , это и this , но по-прежнему трудно создать пользовательскую модель поиска имен. Вот код: public class CustomClassifierTrainer { private static final TokenNameFinderFactory TokenNameFinderFactory =...

181 просмотров

java custom-model-binder opennlp

07.07.2022

Пользовательский OpenNLP Name Finder распознает данные в тренировочном наборе, но не в тестовом.

Итак, я, наконец, включил OpenNLP в свой проект, и я успешно обучил свою модель на 15 тысячах строк обучающих данных, сохранил их и могу загрузить, когда захочу использовать для распознавания сущностей в моей программе! Я использую его для...

537 просмотров

java machine-learning named-entity-recognition opennlp

10.07.2022

Сопоставление openNLP или StanfordNLP в elasticsearch

Я пытаюсь сопоставить openNLP, чтобы включить разбор файла в документе. Используя следующий код: "article": "properties": "content" : { "type" : "opennlp" } Перед созданием сопоставления я загрузил двоичный файл извлечения именованных...

1069 просмотров

opennlp elasticsearch

26.07.2022

Совместное использование UIMA и Stanford Core NLP

UIMA и StanfordNLP производят выходные данные после конвейера операции, например, если мы хотим выполнить тегирование POS, поэтому во входном тексте сначала выполняется токенизация, а затем тегирование POS. Я хочу использовать токенизацию UIMA и...

2158 просмотров

nlp tokenize stanford-nlp opennlp uima

03.08.2022