Я пытаюсь проверить str
, это только тайский символ или нет, используя regex
или любой другой, если он может решить
Я пытаюсь использовать
re.compile(u"[^\u0E00-\u0E7F']|^'|'$|''")
ret = regexp_thai.sub("", s)
чтобы нарезать другой язык или цифру, кстати, это просто нарезка, а не для возврата логического
Я ожидаю результата вроде
s = "engภาษาไทยที่มีสระ123!@"
regexp_thai = re.compile(u"[^\u0E00-\u0E7F']|^'|'$|''")
ret = regexp_thai.sub("", s)
print(ret) # ภาษาไทยที่มีสระ
print(isthai(ret)) # True
u0E00-u0E7F
- это юникод тайского языка. Как я могу написать isthai
функцию
bool(re.match("^[\u0E00-\u0E7F]*$", test))
должен оцениваться какTrue
, еслиtest
состоит только из тайских символов. Еще необходима точная настройка знаков препинания и др. - person Michael Butscher   schedule 24.05.2019