Публикации по теме 'unicode'


ЧТО ЗНАЧИТ UNICODE/UTF?
ЮНИКОД Полная форма Unicode — универсальный стандарт кодировки символов. Название "Юникод" предполагает уникальную, унифицированную, универсальную кодировку. Unicode – это международный стандарт кодирования символов, который обеспечивает уникальный номер для каждого символа в разных языках и алфавитах, что делает доступными почти все символы для разных платформ, программ и устройств. Набор символов Unicode – простой способ разрешить одному приложению работать с любым языком или..

Руководство по Unicode для начинающих 😎
Однажды я провел пару разочаровывающих дней на работе, изучая, как правильно работать со строками Unicode в Python. В течение этих двух дней я съел много закусок - примерно один мешок золотой рыбки на одну из этих обнаруженных ошибок, которые должны быть слишком знакомы тем, кто программирует на Python: UnicodeDecodeError : ‘ascii’ codec can’t decode byte 0xf0 in position 0: ordinal not in range(128) Решая свою проблему, я много гуглил, что указывало мне на несколько незаменимых..

Исправление кода с кодом
Это будет коротко, обещаю. Короче, как код, который исправляет эту ошибку. Я работал над проектом Java, когда появились эти странные ошибки юникода. Я относительно новичок в IntelliJ, и я не мог понять точную причину ошибки. Мои линии были отмечены красным, и я был озадачен. К счастью, поскольку это был проект maven, команда mvn install дала мне точную ошибку - недопустимый символ: ‘
’ Поиск в Google показал, что кто-то сталкивался с этой ошибкой раньше, он фактически удалил все..

Ответ на кодирование и моделирование данных
Распространенное заблуждение, которое люди могут иметь относительно хранения текста, заключается в том, что оно остается неизменным и простым в компьютерах. Дело на самом деле «немного» сложнее, потому что текст на самом деле хранится в виде набора битов, который непонятен людям до тех пор, пока он не будет переведен обратно на известные языки. Биты — это значения, которые компьютер может понимать как истина и ложь или более популярные 1 и 0. Программист может выбирать из множества схем..

7 предположений о строках, которые у вас, вероятно, есть
Автор: Вилле Тирронен Как Unicode стирает большинство наших предположений о том, как на самом деле работают строки Когда дело доходит до написания простых вещей, мы, программисты, в основном остаемся беззащитными. Для простых вещей у нас есть надежный набор предположений вместо конкретных знаний о том, как все работает. Это предположения, например, знание того, что если b = a + 1 , то b больше, чем a , или что если мы malloc какой-то буфер, теперь у нас есть запрошенный объем..

Вопросы по теме 'unicode'

Проблема с строковым литералом Unicode в модульном тесте
У меня есть тест JUnit, который проверяет добавление строк в настраиваемый тип словаря. На компьютере с Linux / Windows все работает нормально для всех остальных, однако, будучи первым разработчиком в моем магазине на Mac, этот модульный тест не...
1344 просмотров
schedule 26.10.2021

Проблема ввода юникода жабы
В жабе я вижу символы юникода, поступающие из oracle db. Но когда я щелкаю одно из полей в сетке данных в режиме редактирования, символы Unicode преобразуются в бессмысленные символы, но это не большая проблема. При редактировании этого поля...
4837 просмотров
schedule 08.09.2021

Юникод и сетевая связь
Я планирую разработать клиентское приложение на базе Windows и серверное приложение, не зависящее от платформы. Клиентское приложение в основном отправляет сообщения серверному приложению. Клиентское приложение может отправлять сообщения на...
464 просмотров
schedule 17.09.2021

Можно ли использовать libxml с unicode xmlchar?
Можно ли использовать libxml с юникодом? Например, функция xmlParseDoc принимает xmlChar xmlChar имеет следующее определение: typedef unsigned char xmlChar; Я хотел бы, чтобы libxml интерпретировал все как 2-байтовые символы. У меня...
1834 просмотров
schedule 18.09.2021

Как мне прочитать строки Unicode-16 из файла с помощью методов POSIX в Linux?
У меня есть файл, содержащий строки UNICODE-16, которые я хотел бы прочитать в программе Linux. Строки были записаны необработанными из внутреннего формата Windows WCHAR. (Всегда ли Windows использует UTF-16? Например, в японских версиях) Я...
4876 просмотров
schedule 20.10.2021

скрипт для сохранения файла как unicode
Знаете ли вы, каким образом я мог бы программно или с помощью scrirpt преобразовать набор текстовых файлов, сохраненных в кодировке символов ansi, в кодировку Unicode? Я хотел бы сделать то же самое, что и, когда открываю файл с помощью блокнота и...
10728 просмотров
schedule 16.10.2021

Юникод в vb.net
Как использовать Unicode, доступный в vb6 в vb.net? Есть ли эквивалент vb6 Unicode в vb.net ??
7069 просмотров
schedule 21.11.2021

Нужна помощь для отображения японского текста с помощью GDI + без установки пакета восточноазиатских языков в Windows XP
Я пишу викторину по японскому языку и не хочу требовать от людей установки языкового пакета для восточноазиатских языков для Windows XP. Я использую GDI + для рисования текста. Я попытался загрузить бесплатный шрифт Unicode и использовать его для...
1895 просмотров
schedule 20.10.2021

правила для слагов и юникода
После небольшого исследования того, как люди по-разному используют заголовки, я заметил, что часто упускается из виду, как работать с неанглоязычными заголовками. Кодировка URL-адреса очень ограничена. См....
2024 просмотров

Может ли Ruby получить имена файлов в папке, если они содержат символы Unicode?
Я писал сценарий в Windows Vista для перемещения файлов из папки на другой жесткий диск, но обнаружил, что Ruby 1.8.6 или 1.9 вернут имена файлов с символами Unicode, замененными на "??????" Так, например, возвращается имя файла "Chart for ???????....
528 просмотров
schedule 04.11.2021

Вывод Unicode в командной строке Windows?
Я написал небольшое Java-приложение, выводящее символы Unicode. Когда я использую Eclipse для его запуска, я вижу весь результат, как и ожидалось. Люди, которые должны использовать приложение, будут запускать его как файл jar. Я думал, что они...
32043 просмотров
schedule 04.11.2021

Как юникод распределяется для разных языков?
Мне это кажется самой запутанной проблемой. Как распознается начало нового персонажа? Как распределяются кодовые точки? Возьмем, к примеру, китайский иероглиф. Какой диапазон кодовых точек им назначен, и почему это так распределено по...
250 просмотров
schedule 13.11.2021

URL-адрес с экранированием китайских / японских символов Юникода для Internet Explorer
Я пытаюсь экранировать (кодировать проценты) символы, отличные от ascii, в нескольких URL-адресах, с которыми я имею дело. Я работаю с флэш-приложением, которое загружает ресурсы, такие как изображения и аудиоклипы, с этих URL-адресов. Поскольку...
9905 просмотров

Каких проблем следует ожидать при переносе устаревшего кода Perl в UTF-8?
До сих пор проект, над которым я работаю, использовал ASCII только в исходном коде. Из-за нескольких предстоящих изменений в области I18N, а также из-за того, что нам нужны некоторые строки Unicode в наших тестах, мы думаем о том, чтобы укусить пулю...
405 просмотров
schedule 22.11.2021

Могут ли BSTR удерживать символы, для представления которых требуется более 16 бит?
Я не понимаю, что такое Windows BSTR, WCHAR и т. Д. WCHAR - это 16-битный символ, предназначенный для использования символов Unicode. А как насчет символов, для представления которых требуется более 16 бит? Некоторые символы UTF-8 требуют большего....
852 просмотров
schedule 24.09.2021

Ширина поля printf: байты или символы?
Семейство printf / fprintf / sprintf поддерживает поле ширины в своем описателе формата. У меня есть сомнения относительно аргументов (не широких) массивов char: Поле ширины должно означать байты или символы? Каково (правильное де-факто)...
5176 просмотров
schedule 19.11.2021

Проверить строку Unicode и Escape, если Unicode недействителен (C / C ++)
У меня есть программа, которая считывает произвольные данные из файловой системы и выводит результаты в Unicode. Проблема, с которой я сталкиваюсь, заключается в том, что иногда имена файлов являются действительными Unicode, а иногда - нет. Поэтому...
2641 просмотров
schedule 08.11.2021

'????' Не допустимый символ Юникода, но в наборе символов Юникода?
Краткая история: я не могу получить такую ​​сущность, как '????', для хранения в базе данных MySQL, либо используя текстовое поле в приложении Ruby on Rails (с кодировкой по умолчанию UTF-8), либо вводя его напрямую с помощью графического интерфейса...
2379 просмотров
schedule 07.09.2021

Проблема поиска Lucene
Я создал индекс для строк моей базы данных (каждая строка как документ), которые имеют тип Unicode в MySQL (например, Charset: utf8 и Collation: utf8-bin). Но когда я ищу любое слово на английском или неанглийском, оно не дает мне никаких ответов....
1711 просмотров
schedule 02.10.2021

Показать шестнадцатеричный дамп строки
Есть ли способ получить шестнадцатеричный дамп строки в SQL Server? Было бы полезно устранить проблемы с набором символов и сопоставлением. В MySQL вы бы сделали SELECT HEX('€uro') , а в Oracle - SELECT DUMP('€uro') FROM DUAL .
39249 просмотров
schedule 29.11.2021