Вопросы по теме 'named-entity-extraction'

Связывание связанных тем IR
Как связать термины (ключевые слова), которые имеют определенную связь между собой, через текстовые документы. Примером может служить google , когда вы ищете человека, он показывает рекомендации других людей, связанных с этим человеком ....
25 просмотров

Как извлечь объекты из HTML с помощью обработки естественного языка или другой техники
Я пытаюсь разобрать объекты с веб-страниц, которые содержат время, место и имя. Я немного читал об обработке естественного языка и извлечении сущностей, но не уверен, что иду по неправильному пути, поэтому спрашиваю здесь. Я еще ничего не начал...
1603 просмотров

Добавить пользовательский файл jape в исходный код GATE
Может ли кто-нибудь объяснить мне, как создать один пользовательский файл JAPE и настроить его с исходным кодом GATE. Я попытался использовать следующий код и получил исключение типа "Ошибка при анализе грамматики:" и "Не заданы ни параметры...
2918 просмотров
schedule 02.09.2022

Распознавание именованных объектов на основе точного словаря в Стэнфорде
У меня есть словарь именованных сущностей, извлеченный из Википедии. Я хочу использовать его как словарь NER. Я хотел знать, как я могу использовать Stanford-NER с этими моими данными. Я также скачал Lingpipe, хотя понятия не имею, как им...
2067 просмотров

Распознавание именованных объектов с использованием Vowpal Wabbit, по-видимому, запоминает данные обучения
Я использую API Python Vowpal Wabbit для обучения классификаторов распознавания именованных объектов для определения имен людей, организаций и местоположений из коротких предложений. Я составил блокнот IPython с подробными данными, как модели...
566 просмотров

Как перебрать файл в python, где записи многострочные с полями, разделенными запятыми, а записи разделены пустой строкой?
Приведенный ниже набор данных состоит из предложений, в которых каждое слово помечено индивидуально. Я хочу разделить это на две переменные для обучения моей модели. Записи разделены пустой строкой, и каждая запись состоит из нескольких строк, где...
51 просмотров
schedule 22.12.2022

Spacy: генерируйте общие предложения, а затем обучайте модель поверх этого. Это хорошая идея?
Я тренирую модель с нуля, чтобы предсказать продукты питания из текста. Я пометил около 500 предложений, чтобы обучить свою модель, и точность довольно хорошая. Но меня немного беспокоят невидимые данные реального мира, поэтому я придумал интересную...
118 просмотров
schedule 20.01.2023

Отношение NLTK к объекту
Я только начал использовать NLTK, и мне кажется, что задача, которую мне нужно выполнить, довольно проста. Мне нужно проанализировать ряд документов и извлечь отношение к некоторым объектам. Например, общее настроение следующего предложения: Tea...
1391 просмотров