Вопросы по теме 'wordnet'

Устранение неоднозначности слов с помощью WordNet.Net
Мне нужно устранить неоднозначность слов в рамках более крупного проекта, и я наткнулся на WordNet.Net Я попытался использовать класс wordsensedisambiguator из загружаемого проекта WordsMatching. Вот мой код. string sent = "We have...
5292 просмотров
schedule 11.11.2021

Как я могу найти синонимы в предполагаемом порядке частоты с помощью JWNL (библиотеки Wordnet)?
Кто-нибудь знает, как я могу взять синонимы слова с помощью JWNL (Java Wordnet Library), упорядоченных по предполагаемой частоте? Я знаю, что это можно как-то сделать, потому что приложение Wordnet может это сделать. (Не знаю, имеет ли это значение,...
2535 просмотров
schedule 24.09.2021

nlp - Как определить, указывает ли слово в предложении на цвет / часть тела / транспортное средство
Итак, как следует из названия, я хотел бы знать, указывает ли определенное слово в предложении на 1] Цвет The grass is green. Следовательно "зеленый" - это цвет 2] Часть тела Her hands are soft Следовательно, «руки» - это часть...
1563 просмотров

Улучшение контекстного поиска
Я рассматривал возможность реализации контекстного поиска отдельного слова с помощью WordNet. Идея такая: Пользователь ищет вирус, он должен возвращать контексты / приложения искомого слова, которыми в нашем случае являются здоровье и вычисления....
236 просмотров
schedule 02.12.2021

как устранить ошибку: AttributeError: объект 'generator' не имеет атрибута 'endwith'
Когда я пытаюсь запустить этот код для предварительной обработки текста, я получаю сообщение об ошибке ниже, у кого-то похожая проблема, но в сообщении недостаточно подробностей. Я помещаю здесь все в контекст, надеясь помочь рецензенту помочь нам...
12550 просмотров

классифицировать / получить слово гипернимального типа с помощью wordnet в python
В моем проекте мне нужно найти категорию / гипернимальный тип конкретного слова. Например, если я наберу «Суши / лев», на выходе будет отображаться еда / животное. Основная концепция - категоризация слова. Итак, как я могу получить это с помощью...
1735 просмотров
schedule 17.11.2021

Поиск корней слова в java с помощью wordnet
Я знаю о гиперниме в wordnet, но поскольку для каждого термина есть несколько значений, я вынужден использовать алгоритм Леска, чтобы найти контекстуальное значение слова. В процессе я увидел вопрос . Я пытаюсь реализовать этот алгоритм, который...
3321 просмотров

Является ли сходство пути wordnet коммутативным?
Я использую API wordnet от nltk. Когда я сравниваю один синсет с другим, я получаю None , но когда я сравниваю их наоборот, я получаю значение с плавающей запятой. Разве они не должны давать одинаковое значение? Есть ли объяснение или это ошибка...
4472 просмотров
schedule 25.03.2022

Как использовать NLTK WordNet для проверки неполных слов в Python?
У меня есть набор слов: {капрал, собака, кошка, distingus, компания, телефон, орган, автомобиль, места, облегченный, правила, резидент, экспертиза} Я хочу вычислить сематическое сходство между каждым словом в предыдущем наборе. У меня...
1460 просмотров
schedule 25.03.2022

Как сортировать веб-сайты по категориям на основе содержания ключевых слов
Я пишу веб-робот, который классифицирует сайты на основе ключевых слов/мета/ссылок в предопределенный список категорий. Я рассматривал различные онтологические подходы и просматривал Wordnet (для гипернима/гипонима), ResearchCyc, WebKb и задавался...
391 просмотров
schedule 26.04.2022

Wordnet с Android
Я хотел найти способ интегрировать базу данных wordnet в приложение для Android и получить к ней прямой доступ. Мой код @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState);...
154 просмотров
schedule 23.04.2022

Кластеризация слов-синонимов с помощью NLTK и Wordnet
Учитывая набор слов V , я хотел бы сгруппировать слова-синонимы в V вместе. Мне интересно, есть ли в NLTK и Wordnet встроенная функция, которая принимает V в качестве входных данных и автоматически группирует их на основе синонимности. Я уже...
1543 просмотров
schedule 27.04.2022

Внутренняя структура SentiWordNet 3
Я работаю над проектом анализа настроений, в котором используется лексикон SentiwordNet3 . Проблема в том, что я не могу понять структуру лексики. Одна строка этого лексикона: a 00002730 0 0 акроскопический №1 лицом или сбоку к апексу...
476 просмотров

WordNet, интегрированный с ElasticSearch - Как добавить новые синонимы
Я работаю с ElasticSearch версии 1.2.3 Я интегрировал WordNet 3.0 в качестве базы данных синонимов для анализатора синонимов ElasticSearch. (Полная установка WordNet: настройка, создание, установка) Я добавил следующий код в настройки...
2584 просмотров
schedule 23.05.2022

Требуется другой Nltk, гипернимный вывод wordnet
Когда я пытаюсь напечатать гиперним, мне просто нужно слово, а не вся информация о слове. pp = wn.synset('grow.v.01') pp1= pp.hypernyms() print pp1 Мой вывод: [Synset('change.v.02')]. Я просто хочу "перемен". Какое изменение мне нужно...
524 просмотров
schedule 09.06.2022

Получение слов из базы данных WordNet
Я ищу веб-сайт, предлагающий API для извлечения слов из английской базы данных WordNet . Я не хочу загружать базу данных WordNet и внедрять ее на свой сервер. Просто я хочу вызвать API и получить результаты в формате XML с этого веб-сайта. У...
2385 просмотров
schedule 16.06.2022

NLTK прыгает по именам синсетов — python
Из NLTK WordNet API: >>> from nltk.corpus import wordnet as wn >>> for i in wn.synsets('discover'): ... print i, i.offset ... Synset('detect.v.01') 2154508 Synset('learn.v.02') 598954 Synset('discover.v.03') 1637982...
278 просмотров
schedule 15.06.2022

Многопоточность в NLTK WordNetLemmatizer?
Я пытаюсь использовать многопоточность, чтобы ускорить процесс. Я использую wordnetlemmatizer для лемматизации слов, и эти слова могут быть в дальнейшем использованы sentiwordnet для вычисления тональности текста. Моя функция анализа настроений, в...
968 просмотров

Как выбрать нужный смысл из wordnet: synset в скрипте python
Я читаю входные данные из файла и вычисляю меры сходства/родства на основе словесной сети, такие как LIN, мера Банерджи и Педерсена (BNP), мера Цзяна и Конрата (JNC) для слов в каждой строке. Я использую следующий код для получения синсетов:...
606 просмотров
schedule 26.07.2022

Данные NLTK устарели — Python 3.4
Я пытаюсь установить NLTK для Python 3.4. Фактический модуль NLTK, похоже, установлен нормально. потом я побежал import nltk nltk.download() и решил скачать все. Однако после того, как это было сделано, окно просто говорит «устарело». Я...
9735 просмотров
schedule 23.07.2022