Я работаю с документами, и мне нужно, чтобы слова выделялись без знаков препинания. Я знаю, как использовать string.split(" ") чтобы сделать каждое слово просто буквой, но пунктуация меня сбивает с толку.
Удалить пунктуацию из строки в Python
comment
вы можете использовать регулярное выражение для соответствия слову
- person co2y   schedule 06.05.2016
comment
дубликат http://stackoverflow.com/questions/265960/best-way-to-strip-punctuation-from-a-string-in-python
- person corinna   schedule 06.05.2016
Ответы (1)
это пример использования регулярного выражения, и результат ['это', 'есть', 'а', 'строка', 'с', 'пунктуация']
s = " ,this ?is a string! with punctuation. "
import re
pattern = re.compile('\w+')
result = pattern.findall(s)
print(result)
person
co2y
schedule
06.05.2016