Вопросы по теме 'surrogate-pairs'

Как перебирать только те символы в строке, которые я действительно вижу?
Обычно я бы просто использовал что-то вроде str[i] . А если str = "☀️????????" ? str[i] не работает. for (x of str) console.log(x) тоже не работает. Он выводит всего 4 символа, хотя в строке явно только 2 смайлика. Каков наилучший...
730 просмотров

Определить все коды скриптов ISO 15924 в строке JavaScript
Я ищу эффективный способ взять строку JavaScript и вернуть все скрипты . которые встречаются в этой строке. Полный UTF-16, включая символы «астрального» плана/не-BMP, для которых требуются суррогатные пары, должен обрабатываться правильно....
207 просмотров

Проблема с суррогатными символами Юникода в F#
Я работаю со строками, которые могут содержать суррогатные символы Юникода (не BMP, 4 байта на символ). Когда я использую формат " \Uxxxxxxxxv " для указания суррогатного символа в F# - для некоторых символов это дает другой результат, чем в случае...
1038 просмотров
schedule 13.04.2023

Получить последний символ строки в текущем современном Javascript, что позволяет использовать астральные символы, такие как Emoji, которые используют суррогатные пары (две единицы кода)
Символы Unicode (кодовые точки), не входящие в базовую многоязычную плоскость (BMP), могут состоять из двух символов (единиц кода), называемых суррогатной парой. «ab» — ​​это две кодовые единицы и две кодовые точки. (Таким образом, два символа и...
136 просмотров

Индексация юникода Python показывает другой символ
У меня есть строка Unicode в «узкой» сборке Python 2.7.10, содержащая символ Unicode. Я пытаюсь использовать этот символ Unicode для поиска в словаре, но когда я индексирую строку, чтобы получить последний символ Unicode, она возвращает другую...
147 просмотров