Вопросы по теме 'pos-tagger'

Обучение теггеру NLTK Brill, но с использованием текстового файла в качестве входных данных
Всем привет. Сейчас я делаю свой последний годовой проект под названием «Tagger Part-Of-Speech Tagger для малайского языка с использованием Brill Tagger». Я хочу спросить, как тренировать предложения с тегами, которые я сохранил в текстовом файле?...
2058 просмотров
schedule 23.11.2021

Tagger для отдельных слов в NLTK
Существует ли средство тегирования, которое возвращало бы один тег для слова в любом контексте? Мое требование состоит в том, что мне нужно извлекать слова из неструктурированного текста, в предложениях которого нет структурированной грамматики....
997 просмотров
schedule 11.10.2021

Ошибка в Stanford Pos Tagger
Здравствуйте, я пытаюсь сделать POS-тег для определенного предложения с помощью Stanford Pos Tagger. Я использую Python 3.4 nltk 3.1 в windows7 Ниже приведен код, который я использовал: import nltk from nltk.tag.stanford import POSTagger import...
837 просмотров

Статус HTTP 500 - javax.servlet.ServletException: java.lang.NoClassDefFoundError: edu / stanford / nlp / tagger / maxent / MaxentTagger
Я пытаюсь пометить свой запрос POS в jsp. когда я запускаю его как java-приложение, он работает нормально, но когда я запускаю его как jsp, я получаю следующее исключение. org.apache.jasper.JasperException: javax.servlet.ServletException:...
932 просмотров
schedule 15.10.2021

AttributeError: объект 'list' не имеет атрибута 'isdigit'
Я хочу распаковать POS в пандах. Я делаю как показано ниже import pandas as pd from nltk.tag import pos_tag df = pd.DataFrame({'pos': ['noun', 'Alice', 'good', 'well', 'city']}) s = df['pos'] tagged_sent = pos_tag(s.str.split()) но получите...
3107 просмотров
schedule 29.09.2021

Оценка POS tagger в NLTK
Я хочу оценить различные теги POS в NLTK, используя текстовый файл в качестве входных данных. Для примера возьму таггер Unigram. Я нашел, как оценивать тег Unigram, используя коричневый корпус. from nltk.corpus import brown import nltk...
3858 просмотров
schedule 14.09.2021

Теггер Stanford POS не работает в сервлете
Я пытаюсь использовать Stanford POS Tagger в сервлете Java. Я создал проект динамической веб-страницы в J2EE и включил путь сборки файлов jar, следуя этому руководству....
448 просмотров
schedule 20.02.2022

Разделение слов NLTK Brill Tagger
Я использую Python версии 3.4.1 и NLTK версии 3, и я пытаюсь использовать их Brill Tagger. Вот обучающий код для теггера brill: import nltk from nltk.tag.brill import * import nltk.tag.brill_trainer as bt from nltk.corpus import brown...
637 просмотров
schedule 20.02.2022

Теггер POS на питоне без NLTK
Я пытаюсь сделать POS-теггер для определителей и предлогов курдского языка сорани. Я использую следующий код, чтобы поставить каждый тег после каждого предложения или определителя в моем курдском тексте. import os SOR = open("SOR-1.txt", "r+",...
432 просмотров
schedule 06.04.2022

Как преобразовать теги CLAWS7 в теги Penn?
Кто-нибудь из вас знает способ преобразовать тег из набора тегов CLAWS7 в его эквивалент в наборе тегов Penn? Набор тегов CLAWS7: http://ucrel.lancs.ac.uk/claws7tags.html Набор тегов Penn:...
294 просмотров
schedule 09.04.2022

пометка pos в nltk с помощью отложенных ngrams
Я попытался сделать тег части речи (или POS) в nltk, но я не могу заставить его работать более чем для одного тега ngram за раз, используя отсрочку. Я читал, что вы используете больше тегов для более высоких результатов, но это не сработает для меня....
4691 просмотров
schedule 08.04.2022

Лемматизация слов после тегирования POS дает неожиданные результаты
Я использую python3.5 с функцией nltk pos_tag и WordNetLemmatizer. Моя цель - сгладить слова в нашей базе данных для классификации текста. Я пытаюсь протестировать с помощью лемматизатора и сталкиваюсь со странным поведением при использовании тега...
1108 просмотров

неверная ошибка zip-файла в тегах POS в NLTK в python
Я новичок в python и NLTK. Я хочу сделать токенизацию слов и POS-тегов в этом. Я установил Nltk 3.0 в свой Ubuntu 14.04 с питоном 2.7.6 по умолчанию. Сначала я попытался сделать токенизацию простого предложения. Но я получаю сообщение об ошибке...
1319 просмотров
schedule 07.05.2022

Как использовать pos_tag в NLTK?
Итак, я пытался пометить кучу слов в списке (точнее, теги POS) следующим образом: pos = [nltk.pos_tag(i,tagset='universal') for i in lw] где lw — это список слов (он очень длинный, иначе я бы опубликовал его, но он похож на...
23947 просмотров
schedule 26.05.2022

Правильные теги POS для номеров, замененных на ## в пространстве
Набор данных gigaword - это огромный корпус, используемый для обучения абстрактных моделей реферирования. Он содержит такие резюме: spain 's colonial posts #.## billion euro loss taiwan shares close down #.## percent Я хочу обработать эти...
609 просмотров
schedule 04.06.2022

Многоязычная POS-маркировка NLTK
Я пытаюсь пометить pos_tag текст, написанный на французском языке. text = unicode("Comment faire pour que mon chien accepte le chat que je vais adopter ? ", errors='ignore') tagged_sents = nltk.pos_tag_sents(nltk.word_tokenize(text)) это...
773 просмотров
schedule 21.06.2022

Почему OpenNLP POSTaggerME такой медленный?
Этот вопрос задавался здесь дважды и не получил никакого ответа. Постараюсь быть более информативным. Проблема: я решил переписать POS-тегер на Java, думая, что он должен быть намного быстрее, чем POS-теггер, который я написал на Python. Для...
898 просмотров
schedule 27.06.2022

Ошибка: нет модуля с именем numpy.core.multiarray. Модель Maxent Tree Bank pos-tagger уже установлена
Это моя программа: import nltk text = "Rabbit is eating" token2 = nltk.word_tokenize(text) print token2 txttoken = nltk.pos_tag(token2) print txttoken Это ошибка, которую я получаю: Traceback (most recent call last): File "PosTag.py",...
3815 просмотров
schedule 06.07.2022

плохая токенизация в стэнфордском постаггере
Я пытаюсь использовать теггер Stanford POS, чтобы пометить текст на французском языке. Для этого я использую следующую команду: файл кота.txt | java -mx10000m -cp 'stanford-postagger.jar:' edu.stanford.nlp.tagger.maxent.MaxentTagger -model...
468 просмотров
schedule 04.07.2022

Набор тегов NLTK POS не работает
Я скачал справку по набору тегов nltk, не работает. Всякий раз, когда я пытаюсь получить доступ к значениям набора тегов: - nltk.help.upenn_tagset('NN') Я получаю результат как: - Traceback (most recent call last): File...
1087 просмотров
schedule 21.07.2022