ICU: Что означает NFD и NFC?

Я нашел фрагмент, который читает

Any-Latin; NFD; [:Nonspacing Mark:] Remove; NFC; [:Punctuation:] Remove; Lower();

... и предполагается, что произвольная строка хорошо вписывается в URL.

Итак, я предполагаю, что вещи между точками с запятой — это что-то вроде «команд», которые должны быть выполнены, но что конкретно означают NDF и NFC? Я действительно ничего не нашел даже в официальной документации...


person Adrian Föder    schedule 14.05.2016    source источник
comment
w3.org/TR/charmod-norm/#normalization_forms   -  person Hans Passant    schedule 14.05.2016
comment
ой спасибо; вы должны были опубликовать это как ответ, потому что я могу принять это ... что мне делать?   -  person Adrian Föder    schedule 17.05.2016
comment
Если эта ссылка не поможет вам написать свой собственный ответ, мне придется извиниться.   -  person Hans Passant    schedule 17.05.2016
comment
@HansPassant, однако, это хорошая страница.   -  person Steven R. Loomis    schedule 19.07.2016
comment
@AdrianFöder, где вы смотрели официальную документацию? Спрашиваю, чтобы я мог улучшить его.   -  person Steven R. Loomis    schedule 20.07.2016


Ответы (1)


См. транслитераторы ICU и связанную страницу на формы нормализации TR15 для полных примеров.

Форма нормализации D (NFD) Каноническая декомпозиция

Форма нормализации C (NFC) Каноническая декомпозиция, за которой следует каноническая композиция

Форма нормализации KD (NFKD) Разложение совместимости

Разложение совместимости формы нормализации KC (NFKC) с последующей канонической композицией

person Steven R. Loomis    schedule 19.07.2016