Вопросы по теме 'opennlp'
Есть ли способ получить тему предложения с помощью OpenNLP?
Есть ли способ получить тему предложения с помощью OpenNLP? Я пытаюсь выделить самую важную часть предложения пользователя. Как правило, пользователи будут отправлять предложения в наш «движок», и мы хотим точно знать, какова основная тема этого...
9704 просмотров
schedule
28.09.2021
Обнаружена непредвиденная аннотация при обработке последовательности имен
Я хотел пройти обучение функциональности распознавания именованных сущностей в OpenNLP. Я написал фрагмент кода в соответствии с http://opennlp.apache.org/documentation/1.5.2-incubating/manual/opennlp.html#tools.namefind
Я начал с тривиального...
1244 просмотров
schedule
26.09.2021
Как определить PP-теги / NP-теги / VP-теги в чункере openNLP?
Я хочу посчитать количество pp / np / vp в тексте, но я не знаю, как определить PP-теги / NP-теги / VP-теги в блоке chunker openNLP? Я пробовал этот код, но он не работает.
ChunkerModel cModel = new ChunkerModel(modelIn);
ChunkerME chunkerME =...
377 просмотров
schedule
02.12.2021
Встроенный Porter Stemmer в java opennlp toolkit
Как будто есть встроенные в Stemmers, такие как porter Stemmer в python nltk ( https://stackoverflow.com/a/10369407/3096792 ), Я хочу знать, есть ли встроенный Porter Stemmer в java apache opennlp, хотя в этом пакете есть интерфейс...
4149 просмотров
schedule
09.09.2021
открытое обучение nlp с именем entity
Я обучаю модель распознавания именованных сущностей, но она неправильно определяет имена людей?
мои тренировочные данные выглядят так:
<START:person> Pierre Vinken <END> , 61 years old , will join the board as a nonexecutive...
561 просмотров
schedule
06.10.2021
Почему классификатор документов OpenNLP так быстро обучается?
OpenNLP значительно уступает другим классификаторам документов, которые я тестировал, поэтому, прежде чем я откажусь от него, я решил убедиться, что поиграю со всеми наборами и ручками. Одна вещь, которая выделялась для меня, заключалась в том, что...
113 просмотров
schedule
26.11.2021
Тренер OpenNLP doccat всегда дает 1 шаблон результата
Я оцениваю OpenNLP для использования в качестве классификатора документов. У меня есть продезинфицированный учебный корпус с примерно 4К файлами примерно по 150 категориям. В документах есть много общих, в основном не относящихся к делу слов, но...
55 просмотров
schedule
28.10.2021
Визуализируйте структуру дерева синтаксического анализа
Я хотел бы отобразить синтаксический анализ (теги POS) из openNLP в виде визуализации древовидной структуры. Ниже я привожу дерево синтаксического анализа из openNLP , но я не могу построить его как визуальное дерево, обычное для Синтаксический...
5045 просмотров
schedule
26.03.2022
Обучение модели классификатора Opennlp
Я пытаюсь обучить модель с помощью приведенного ниже кода, но я продолжаю получать сообщение об ошибке в методе DocumentCategorizerME.train() , который говорит мне изменить factory на doccatfactory . Зачем?
public void trainModel()
{...
161 просмотров
schedule
04.04.2022
Как подготовить обучающие данные для OpenNLP для токенизации токена, содержащего более одного слова?
В некоторых языках (например, вьетнамском) некоторая лексика состоит из нескольких слов. Так что некоторые токены, которые содержат более одного слова, могут быть токенизированы не только с использованием пробела.
У меня есть следующий ввод:...
534 просмотров
schedule
09.05.2022
Разрешение базовой ссылки с использованием OpenNLP
Я хочу выполнить "разрешение базовой ссылки" с помощью OpenNLP. Документация Apache ( Разрешение базовой ссылки ) не распространяется как сделать "разрешение кореференции" . У кого-нибудь есть документы/учебник, как это сделать?
5698 просмотров
schedule
14.05.2022
Инструмент анализа настроений с использованием SentiWordNet и Apache OpenNLP
Я работаю над инструментом анализа настроений, используя SentiWordNet и Apache NLP . Проблема в том, что когда я помечаю предложение с помощью библиотеки НЛП, я получаю такой результат, как
Test_NNP Tweet_NNP is_VBZ ready_JJ now_RB for_IN...
878 просмотров
schedule
24.05.2022
Запрос тегов части речи с Lucene 7 OpenNLP
Для развлечения и обучения я пытаюсь создать теггер части речи (POS) с OpenNLP и Lucene 7.4. Цель состоит в том, чтобы после индексации я мог действительно искать последовательность тегов POS и находить все предложения, соответствующие...
482 просмотров
schedule
21.05.2022
Как добавить функцию POS-тега в инструмент распознавания именованных объектов OpenNLP
Я пытаюсь настроить OpenNLP NameFinder в проекте с функцией тега части речи. Я расширил свой класс объектов из FeatureGeneratorAdapter и переопределил следующий метод. К сожалению, этот метод принимает в качестве параметра только необработанные...
418 просмотров
schedule
06.06.2022
RMarkdown Shiny падает при рендеринге графика ggplot
Я пытаюсь создать интерактивный файл уценки с помощью Shiny, и у меня возникают проблемы с использованием ggplot с библиотеками, использующими rJava. Использование rJava не вызывает проблем.
Мне пришлось использовать openNLP для некоторых операций...
339 просмотров
schedule
15.06.2022
Почему OpenNLP POSTaggerME такой медленный?
Этот вопрос задавался здесь дважды и не получил никакого ответа. Постараюсь быть более информативным.
Проблема: я решил переписать POS-тегер на Java, думая, что он должен быть намного быстрее, чем POS-теггер, который я написал на Python. Для...
898 просмотров
schedule
27.06.2022
Обучение пользовательской модели opennlp
Привет, вы уже ссылались на это , это , это и this , но по-прежнему трудно создать пользовательскую модель поиска имен. Вот код:
public class CustomClassifierTrainer {
private static final TokenNameFinderFactory TokenNameFinderFactory =...
181 просмотров
schedule
07.07.2022
Пользовательский OpenNLP Name Finder распознает данные в тренировочном наборе, но не в тестовом.
Итак, я, наконец, включил OpenNLP в свой проект, и я успешно обучил свою модель на 15 тысячах строк обучающих данных, сохранил их и могу загрузить, когда захочу использовать для распознавания сущностей в моей программе!
Я использую его для...
537 просмотров
schedule
10.07.2022
Сопоставление openNLP или StanfordNLP в elasticsearch
Я пытаюсь сопоставить openNLP, чтобы включить разбор файла в документе. Используя следующий код:
"article":
"properties":
"content" : { "type" : "opennlp" }
Перед созданием сопоставления я загрузил двоичный файл извлечения именованных...
1069 просмотров
schedule
26.07.2022
Совместное использование UIMA и Stanford Core NLP
UIMA и StanfordNLP производят выходные данные после конвейера операции, например, если мы хотим выполнить тегирование POS, поэтому во входном тексте сначала выполняется токенизация, а затем тегирование POS.
Я хочу использовать токенизацию UIMA и...
2158 просмотров
schedule
03.08.2022