Вопросы по теме 'pos-tagger'
Обучение теггеру NLTK Brill, но с использованием текстового файла в качестве входных данных
Всем привет. Сейчас я делаю свой последний годовой проект под названием «Tagger Part-Of-Speech Tagger для малайского языка с использованием Brill Tagger».
Я хочу спросить, как тренировать предложения с тегами, которые я сохранил в текстовом файле?...
2058 просмотров
schedule
23.11.2021
Tagger для отдельных слов в NLTK
Существует ли средство тегирования, которое возвращало бы один тег для слова в любом контексте?
Мое требование состоит в том, что мне нужно извлекать слова из неструктурированного текста, в предложениях которого нет структурированной грамматики....
997 просмотров
schedule
11.10.2021
Ошибка в Stanford Pos Tagger
Здравствуйте, я пытаюсь сделать POS-тег для определенного предложения с помощью Stanford Pos Tagger. Я использую Python 3.4 nltk 3.1 в windows7 Ниже приведен код, который я использовал:
import nltk
from nltk.tag.stanford import POSTagger
import...
837 просмотров
schedule
16.09.2021
Статус HTTP 500 - javax.servlet.ServletException: java.lang.NoClassDefFoundError: edu / stanford / nlp / tagger / maxent / MaxentTagger
Я пытаюсь пометить свой запрос POS в jsp. когда я запускаю его как java-приложение, он работает нормально, но когда я запускаю его как jsp, я получаю следующее исключение.
org.apache.jasper.JasperException: javax.servlet.ServletException:...
932 просмотров
schedule
15.10.2021
AttributeError: объект 'list' не имеет атрибута 'isdigit'
Я хочу распаковать POS в пандах. Я делаю как показано ниже
import pandas as pd
from nltk.tag import pos_tag
df = pd.DataFrame({'pos': ['noun', 'Alice', 'good', 'well', 'city']})
s = df['pos']
tagged_sent = pos_tag(s.str.split())
но получите...
3107 просмотров
schedule
29.09.2021
Оценка POS tagger в NLTK
Я хочу оценить различные теги POS в NLTK, используя текстовый файл в качестве входных данных.
Для примера возьму таггер Unigram. Я нашел, как оценивать тег Unigram, используя коричневый корпус.
from nltk.corpus import brown
import nltk...
3858 просмотров
schedule
14.09.2021
Теггер Stanford POS не работает в сервлете
Я пытаюсь использовать Stanford POS Tagger в сервлете Java. Я создал проект динамической веб-страницы в J2EE и включил путь сборки файлов jar, следуя этому руководству....
448 просмотров
schedule
20.02.2022
Разделение слов NLTK Brill Tagger
Я использую Python версии 3.4.1 и NLTK версии 3, и я пытаюсь использовать их Brill Tagger.
Вот обучающий код для теггера brill:
import nltk
from nltk.tag.brill import *
import nltk.tag.brill_trainer as bt
from nltk.corpus import brown...
637 просмотров
schedule
20.02.2022
Теггер POS на питоне без NLTK
Я пытаюсь сделать POS-теггер для определителей и предлогов курдского языка сорани. Я использую следующий код, чтобы поставить каждый тег после каждого предложения или определителя в моем курдском тексте.
import os
SOR = open("SOR-1.txt", "r+",...
432 просмотров
schedule
06.04.2022
Как преобразовать теги CLAWS7 в теги Penn?
Кто-нибудь из вас знает способ преобразовать тег из набора тегов CLAWS7 в его эквивалент в наборе тегов Penn?
Набор тегов CLAWS7: http://ucrel.lancs.ac.uk/claws7tags.html
Набор тегов Penn:...
294 просмотров
schedule
09.04.2022
пометка pos в nltk с помощью отложенных ngrams
Я попытался сделать тег части речи (или POS) в nltk, но я не могу заставить его работать более чем для одного тега ngram за раз, используя отсрочку. Я читал, что вы используете больше тегов для более высоких результатов, но это не сработает для меня....
4691 просмотров
schedule
08.04.2022
Лемматизация слов после тегирования POS дает неожиданные результаты
Я использую python3.5 с функцией nltk pos_tag и WordNetLemmatizer. Моя цель - сгладить слова в нашей базе данных для классификации текста. Я пытаюсь протестировать с помощью лемматизатора и сталкиваюсь со странным поведением при использовании тега...
1108 просмотров
schedule
30.04.2022
неверная ошибка zip-файла в тегах POS в NLTK в python
Я новичок в python и NLTK. Я хочу сделать токенизацию слов и POS-тегов в этом. Я установил Nltk 3.0 в свой Ubuntu 14.04 с питоном 2.7.6 по умолчанию. Сначала я попытался сделать токенизацию простого предложения. Но я получаю сообщение об ошибке...
1319 просмотров
schedule
07.05.2022
Как использовать pos_tag в NLTK?
Итак, я пытался пометить кучу слов в списке (точнее, теги POS) следующим образом:
pos = [nltk.pos_tag(i,tagset='universal') for i in lw]
где lw — это список слов (он очень длинный, иначе я бы опубликовал его, но он похож на...
23947 просмотров
schedule
26.05.2022
Правильные теги POS для номеров, замененных на ## в пространстве
Набор данных gigaword - это огромный корпус, используемый для обучения абстрактных моделей реферирования. Он содержит такие резюме:
spain 's colonial posts #.## billion euro loss
taiwan shares close down #.## percent
Я хочу обработать эти...
609 просмотров
schedule
04.06.2022
Многоязычная POS-маркировка NLTK
Я пытаюсь пометить pos_tag текст, написанный на французском языке.
text = unicode("Comment faire pour que mon chien accepte le chat que je vais adopter ? ", errors='ignore')
tagged_sents = nltk.pos_tag_sents(nltk.word_tokenize(text))
это...
773 просмотров
schedule
21.06.2022
Почему OpenNLP POSTaggerME такой медленный?
Этот вопрос задавался здесь дважды и не получил никакого ответа. Постараюсь быть более информативным.
Проблема: я решил переписать POS-тегер на Java, думая, что он должен быть намного быстрее, чем POS-теггер, который я написал на Python. Для...
898 просмотров
schedule
27.06.2022
Ошибка: нет модуля с именем numpy.core.multiarray. Модель Maxent Tree Bank pos-tagger уже установлена
Это моя программа:
import nltk
text = "Rabbit is eating"
token2 = nltk.word_tokenize(text)
print token2
txttoken = nltk.pos_tag(token2)
print txttoken
Это ошибка, которую я получаю:
Traceback (most recent call last):
File "PosTag.py",...
3815 просмотров
schedule
06.07.2022
плохая токенизация в стэнфордском постаггере
Я пытаюсь использовать теггер Stanford POS, чтобы пометить текст на французском языке. Для этого я использую следующую команду:
файл кота.txt | java -mx10000m -cp 'stanford-postagger.jar:' edu.stanford.nlp.tagger.maxent.MaxentTagger -model...
468 просмотров
schedule
04.07.2022
Набор тегов NLTK POS не работает
Я скачал справку по набору тегов nltk, не работает.
Всякий раз, когда я пытаюсь получить доступ к значениям набора тегов: -
nltk.help.upenn_tagset('NN')
Я получаю результат как: -
Traceback (most recent call last):
File...
1087 просмотров
schedule
21.07.2022