Кто-нибудь знает о каких-либо реализациях JavaScript для UAX #29, сегментация текста Unicode? Меня особенно интересуют границы слов.
Я был полон надежд, когда наткнулся на XRegExp, но, похоже, он использует стандартную реализацию JavaScript для \b
.