За последние два часа я много занимаюсь сексом со строками тайского скрипта, которые проскользнули в мою базу данных. Они таинственным образом сопоставляются, видоизменяются при выводе, не имеют естественного порядка и являются катастрофой.
Я хочу просто игнорировать любые строки с символами тайского сценария, но я понятия не имею, как:
Pattern.compile("\\p{Thai}")
не работает при инициализации. "[ก-๛]"
- это когда-нибудь сработает? Какой правильный путь?