Вопросы по теме 'opennlp'

Есть ли способ получить тему предложения с помощью OpenNLP?
Есть ли способ получить тему предложения с помощью OpenNLP? Я пытаюсь выделить самую важную часть предложения пользователя. Как правило, пользователи будут отправлять предложения в наш «движок», и мы хотим точно знать, какова основная тема этого...
9704 просмотров
schedule 28.09.2021

Обнаружена непредвиденная аннотация при обработке последовательности имен
Я хотел пройти обучение функциональности распознавания именованных сущностей в OpenNLP. Я написал фрагмент кода в соответствии с http://opennlp.apache.org/documentation/1.5.2-incubating/manual/opennlp.html#tools.namefind Я начал с тривиального...
1244 просмотров
schedule 26.09.2021

Как определить PP-теги / NP-теги / VP-теги в чункере openNLP?
Я хочу посчитать количество pp / np / vp в тексте, но я не знаю, как определить PP-теги / NP-теги / VP-теги в блоке chunker openNLP? Я пробовал этот код, но он не работает. ChunkerModel cModel = new ChunkerModel(modelIn); ChunkerME chunkerME =...
377 просмотров
schedule 02.12.2021

Встроенный Porter Stemmer в java opennlp toolkit
Как будто есть встроенные в Stemmers, такие как porter Stemmer в python nltk ( https://stackoverflow.com/a/10369407/3096792 ), Я хочу знать, есть ли встроенный Porter Stemmer в java apache opennlp, хотя в этом пакете есть интерфейс...
4149 просмотров

открытое обучение nlp с именем entity
Я обучаю модель распознавания именованных сущностей, но она неправильно определяет имена людей? мои тренировочные данные выглядят так: <START:person> Pierre Vinken <END> , 61 years old , will join the board as a nonexecutive...
561 просмотров
schedule 06.10.2021

Почему классификатор документов OpenNLP так быстро обучается?
OpenNLP значительно уступает другим классификаторам документов, которые я тестировал, поэтому, прежде чем я откажусь от него, я решил убедиться, что поиграю со всеми наборами и ручками. Одна вещь, которая выделялась для меня, заключалась в том, что...
113 просмотров
schedule 26.11.2021

Тренер OpenNLP doccat всегда дает 1 шаблон результата
Я оцениваю OpenNLP для использования в качестве классификатора документов. У меня есть продезинфицированный учебный корпус с примерно 4К файлами примерно по 150 категориям. В документах есть много общих, в основном не относящихся к делу слов, но...
55 просмотров
schedule 28.10.2021

Визуализируйте структуру дерева синтаксического анализа
Я хотел бы отобразить синтаксический анализ (теги POS) из openNLP в виде визуализации древовидной структуры. Ниже я привожу дерево синтаксического анализа из openNLP , но я не могу построить его как визуальное дерево, обычное для Синтаксический...
5045 просмотров
schedule 26.03.2022

Обучение модели классификатора Opennlp
Я пытаюсь обучить модель с помощью приведенного ниже кода, но я продолжаю получать сообщение об ошибке в методе DocumentCategorizerME.train() , который говорит мне изменить factory на doccatfactory . Зачем? public void trainModel() {...
161 просмотров
schedule 04.04.2022

Как подготовить обучающие данные для OpenNLP для токенизации токена, содержащего более одного слова?
В некоторых языках (например, вьетнамском) некоторая лексика состоит из нескольких слов. Так что некоторые токены, которые содержат более одного слова, могут быть токенизированы не только с использованием пробела. У меня есть следующий ввод:...
534 просмотров
schedule 09.05.2022

Разрешение базовой ссылки с использованием OpenNLP
Я хочу выполнить "разрешение базовой ссылки" с помощью OpenNLP. Документация Apache ( Разрешение базовой ссылки ) не распространяется как сделать "разрешение кореференции" . У кого-нибудь есть документы/учебник, как это сделать?
5698 просмотров
schedule 14.05.2022

Инструмент анализа настроений с использованием SentiWordNet и Apache OpenNLP
Я работаю над инструментом анализа настроений, используя SentiWordNet и Apache NLP . Проблема в том, что когда я помечаю предложение с помощью библиотеки НЛП, я получаю такой результат, как Test_NNP Tweet_NNP is_VBZ ready_JJ now_RB for_IN...
878 просмотров

Запрос тегов части речи с Lucene 7 OpenNLP
Для развлечения и обучения я пытаюсь создать теггер части речи (POS) с OpenNLP и Lucene 7.4. Цель состоит в том, чтобы после индексации я мог действительно искать последовательность тегов POS и находить все предложения, соответствующие...
482 просмотров
schedule 21.05.2022

Как добавить функцию POS-тега в инструмент распознавания именованных объектов OpenNLP
Я пытаюсь настроить OpenNLP NameFinder в проекте с функцией тега части речи. Я расширил свой класс объектов из FeatureGeneratorAdapter и переопределил следующий метод. К сожалению, этот метод принимает в качестве параметра только необработанные...
418 просмотров
schedule 06.06.2022

RMarkdown Shiny падает при рендеринге графика ggplot
Я пытаюсь создать интерактивный файл уценки с помощью Shiny, и у меня возникают проблемы с использованием ggplot с библиотеками, использующими rJava. Использование rJava не вызывает проблем. Мне пришлось использовать openNLP для некоторых операций...
339 просмотров
schedule 15.06.2022

Почему OpenNLP POSTaggerME такой медленный?
Этот вопрос задавался здесь дважды и не получил никакого ответа. Постараюсь быть более информативным. Проблема: я решил переписать POS-тегер на Java, думая, что он должен быть намного быстрее, чем POS-теггер, который я написал на Python. Для...
898 просмотров
schedule 27.06.2022

Обучение пользовательской модели opennlp
Привет, вы уже ссылались на это , это , это и this , но по-прежнему трудно создать пользовательскую модель поиска имен. Вот код: public class CustomClassifierTrainer { private static final TokenNameFinderFactory TokenNameFinderFactory =...
181 просмотров
schedule 07.07.2022

Пользовательский OpenNLP Name Finder распознает данные в тренировочном наборе, но не в тестовом.
Итак, я, наконец, включил OpenNLP в свой проект, и я успешно обучил свою модель на 15 тысячах строк обучающих данных, сохранил их и могу загрузить, когда захочу использовать для распознавания сущностей в моей программе! Я использую его для...
537 просмотров

Сопоставление openNLP или StanfordNLP в elasticsearch
Я пытаюсь сопоставить openNLP, чтобы включить разбор файла в документе. Используя следующий код: "article": "properties": "content" : { "type" : "opennlp" } Перед созданием сопоставления я загрузил двоичный файл извлечения именованных...
1069 просмотров
schedule 26.07.2022

Совместное использование UIMA и Stanford Core NLP
UIMA и StanfordNLP производят выходные данные после конвейера операции, например, если мы хотим выполнить тегирование POS, поэтому во входном тексте сначала выполняется токенизация, а затем тегирование POS. Я хочу использовать токенизацию UIMA и...
2158 просмотров
schedule 03.08.2022