Вопросы по теме 'utf-16'

Как я могу проверить наличие имен файлов UTF-16 в Perl?
У меня есть текстовый файл в кодировке UTF-16. Каждая строка содержит ряд столбцов, разделенных табуляцией. Для тех, кому не все равно, файл представляет собой экспортный TXT-файл плейлиста из iTunes. В столбце № 27 указано имя файла. Я читаю...
877 просмотров
schedule 13.09.2021

Переносимые буквальные строки в исходных файлах C
Хорошо, у меня есть это: AllocConsole(); SetConsoleOutputCP(CP_UTF8); HANDLE consoleHandle = GetStdHandle(STD_OUTPUT_HANDLE); WriteConsoleA(consoleHandle, "aΕλληνικά\n", 10, NULL, NULL); WriteConsoleW(consoleHandle, L"wΕλληνικά\n", 10, NULL,...
348 просмотров
schedule 03.10.2021

Проблемы с кодированием при объединении с Powershell
Из группы файлов я хочу объединить все файлы, имя которых начинается с 1, в текстовый файл с именем 1.txt. Кодировка исходных файлов - UTF16-LE, и она также должна быть кодировкой целевого файла. Но использование моего сценария PowerShell (код ниже)...
1330 просмотров

dos2unix: двоичный символ 0x04 в строке 1703
Я загружаю файл из OECD http://stats.oecd.org/Index.aspx?datasetcode=CRS1 ('CRS 2013 data.txt') выбрав Экспорт-> Связанные файлы. Я хочу работать с этим файлом в Ubuntu (14.04 LTS). Когда я бегу: dos2unix CRS\ 2013\ data.txt Я...
11498 просмотров
schedule 20.10.2021

Какова структура памяти строк в кодировке UTF-16 в Visual Studio 2015?
WinAPI использует wchar_t буферов. Насколько я понимаю, нам нужно использовать UTF-16 для кодирования всех наших аргументов в WinAPI. У нас есть две версии UTF-16: UTF-16be и UTF-16le . Кодируем строку «Пример» 0x45 0x78 0x61 0x6d 0x70 0x6c...
136 просмотров
schedule 24.11.2021

Почему, когда я вставляю кодировку = UTF-16BE в xml, хэш отличается?
Следующий метод генерирует XmlDocument из строки, а затем вызывает другой метод для генерации хэша созданного XmlDocument. private void geraXML() { XmlDocument xmlDoc = new XmlDocument(); xmlDoc.PreserveWhitespace = true;...
61 просмотров
schedule 27.10.2021

Указание сегодняшней даты в XML-файле
Я новичок в файлах XML в целом, и мне нужна помощь, чтобы вставить сегодняшнюю дату в мой файл для импорта в планировщик задач. Я экспортировал задачу, которую мне нужно будет запустить на нескольких компьютерах в ближайшем будущем, но она сохраняет...
601 просмотров
schedule 07.09.2021

PHP - как обрабатывать строку HTML в кодировке utf-16, us-ascii для правильного сохранения в DomDocument?
Я работаю над проектом PHP, который получает электронные письма и отображает их на экране. В электронном письме он получает следующий HTML-код: <html> <head> <META http-equiv="Content-Type" content="text/html;...
105 просмотров
schedule 14.09.2021

Проблемы спецификации Java 11 UTF-16 с com.sun.org.apache.xerces.internal.impl.XMLStreamReaderImpl
У меня есть XML-файл UTF-16: <?xml version="1.0" encoding="utf-16" standalone="yes"?> Начинается с спецификации FE FF. Перенося свой код на Java 11, я получаю: Caused by: javax.xml.stream.XMLStreamException: ParseError at...
476 просмотров
schedule 15.09.2021

Отображение эмодзи UTF-8 в Java
Скажем, у меня есть смайлик ???? (дьявол). В 4-байтовом UTF-8 это выглядит так: \u00f0\u009f\u0098\u0088 Однако в Java он будет печатать правильно только так: \ud83d\ude08 Как мне перейти от первого ко второму? ОБНОВЛЕНИЕ 2 Ответ...
1263 просмотров
schedule 10.11.2021

Как заставить Delphi 2006 TStringList.LoadFromFile загружать файлы UTF-16
У меня есть приложение Delphi 2006, в которое я добавляю код для обработки некоторых сгенерированных файлов данных CSV. TStringList.LoadFromFile давал странные результаты, и я только что выяснил, что файлы закодированы в UTF-16. Обновление до XE...
4187 просмотров

в swift, как суррогатная пара utf16 представлена ​​​​в бите
В настоящее время я изучаю Swift, используя язык быстрого программирования книги 3.1. В книге указано, что типы Swift String и Character полностью совместимы с юникодом, причем каждый символ представлен 21-битным скалярным значением юникода....
299 просмотров
schedule 20.02.2022

Как Java хранит символы UTF-16 в своем 16-битном типе char?
Согласно спецификации Java SE 7 , Java использует стандарт Unicode UTF-16 для представления символов. Если представить String как простой массив из 16-битных переменных, каждая из которых содержит по одному символу, жизнь проста. К сожалению,...
10286 просмотров
schedule 28.02.2022

Разница между Mac и Linux iconv от UTF16 до UTF8
Я уверен, что это одно из тех странных различий между Linux и Mac. В Linux я могу преобразовать файл с кодировкой UTF-16 в файл с кодировкой UTF-8, выполнив: iconv -f UTF-16 -t UTF-8 /tmp/geocache_visits.txt >...
1564 просмотров
schedule 27.02.2022

Какой смысл в UTF-16?
Я никогда не понимал смысла кодировки UTF-16. Если вам нужно иметь возможность обрабатывать строки как произвольный доступ (т. е. кодовая точка совпадает с кодовой единицей), вам нужна UTF-32, поскольку UTF-16 по-прежнему имеет переменную длину....
17279 просмотров
schedule 22.03.2022

Получить необработанные двоичные данные из значения атрибута XML, проанализированного с помощью SAX в Java
Я разбираю XML-документ, содержащий текстовые строки, полученные из различных входных текстовых файлов без информации об их кодировке, которые хранятся как значения атрибутов. Сам XML-документ создается с определенной кодировкой, но текстовые строки...
916 просмотров
schedule 20.03.2022

Java 8 UTF-16 не является кодировкой по умолчанию, а UTF-8
Я немного кодировал с помощью String в Java8, Java 11, но этот вопрос основан на Java 8. У меня есть этот небольшой фрагмент. final char e = (char)200;//È Я просто думал, что символы между 0,255 [Ascii + расширенный Ascii] всегда будут...
808 просмотров
schedule 31.03.2022

Следует ли мне перейти с UTF-8 на UTF-16, чтобы использовать китайские символы в моем HTML?
Я использую ASP.NET MVC, MS SQL и IIS. У меня есть несколько пользователей, которые использовали китайские иероглифы в информации своего профиля. Однако, когда я показываю эту информацию, она отображается как...
33495 просмотров
schedule 15.04.2022

Perl: открыть выходной файл с тем же порядком байтов, что и входной файл — UTF-16be против UTF-16le
Когда Perl открывает файл в кодировке UTF-16, open my $in, "< :encoding(UTF-16)", "text-utf16le.txt" or die "Error $!\n"; он автоматически определяет порядок байтов благодаря Знак порядка следования байтов . Но когда я открываю файл...
119 просмотров
schedule 24.04.2022

Преобразование wchar_t* в строку UTF-16
Мне нужен код на C++ для преобразования строки, заданной в wchar_t* , в строку UTF-16. Он должен работать как в Windows, так и в Linux. Я просмотрел много веб-страниц во время поиска, но тема мне так и не ясна. Как я понимаю нужно: Вызовите...
8602 просмотров
schedule 01.05.2022