Привет, я пытаюсь найти слова с помощью стеммера Python, я пробовал Porter и Lancaster, но у них та же проблема. Они не могут правильно образовать слова, оканчивающиеся на "er" или "e".
например, они вытекают
computer --> comput
rotate --> rotat
это часть кода
line=line.lower()
line=re.sub(r'[^a-z0-9 ]',' ',line)
line=line.split()
line=[x for x in line if x not in stops]
line=[ porter.stem(word, 0, len(word)-1) for word in line]
# or 'line=[ st.stem(word) for word in line]'
return line
любая идея исправить эту проблему?
computer -> comput
не правильно? Я могу ошибаться, ноcomput
выглядит как основа дляcomputing
,computed
,computer
,computation
. Например,rotat
кажется обычным дляrotate
,rotation
и т. д. - person Steve K   schedule 08.08.2014