Вопросы по теме 'utf-16'
Как я могу проверить наличие имен файлов UTF-16 в Perl?
У меня есть текстовый файл в кодировке UTF-16. Каждая строка содержит ряд столбцов, разделенных табуляцией. Для тех, кому не все равно, файл представляет собой экспортный TXT-файл плейлиста из iTunes. В столбце № 27 указано имя файла.
Я читаю...
877 просмотров
schedule
13.09.2021
Переносимые буквальные строки в исходных файлах C
Хорошо, у меня есть это:
AllocConsole();
SetConsoleOutputCP(CP_UTF8);
HANDLE consoleHandle = GetStdHandle(STD_OUTPUT_HANDLE);
WriteConsoleA(consoleHandle, "aΕλληνικά\n", 10, NULL, NULL);
WriteConsoleW(consoleHandle, L"wΕλληνικά\n", 10, NULL,...
348 просмотров
schedule
03.10.2021
Проблемы с кодированием при объединении с Powershell
Из группы файлов я хочу объединить все файлы, имя которых начинается с 1, в текстовый файл с именем 1.txt. Кодировка исходных файлов - UTF16-LE, и она также должна быть кодировкой целевого файла. Но использование моего сценария PowerShell (код ниже)...
1330 просмотров
schedule
23.09.2021
dos2unix: двоичный символ 0x04 в строке 1703
Я загружаю файл из OECD http://stats.oecd.org/Index.aspx?datasetcode=CRS1 ('CRS 2013 data.txt') выбрав Экспорт-> Связанные файлы. Я хочу работать с этим файлом в Ubuntu (14.04 LTS).
Когда я бегу:
dos2unix CRS\ 2013\ data.txt
Я...
11498 просмотров
schedule
20.10.2021
Какова структура памяти строк в кодировке UTF-16 в Visual Studio 2015?
WinAPI использует wchar_t буферов. Насколько я понимаю, нам нужно использовать UTF-16 для кодирования всех наших аргументов в WinAPI.
У нас есть две версии UTF-16: UTF-16be и UTF-16le . Кодируем строку «Пример» 0x45 0x78 0x61 0x6d 0x70 0x6c...
136 просмотров
schedule
24.11.2021
Почему, когда я вставляю кодировку = UTF-16BE в xml, хэш отличается?
Следующий метод генерирует XmlDocument из строки, а затем вызывает другой метод для генерации хэша созданного XmlDocument.
private void geraXML()
{
XmlDocument xmlDoc = new XmlDocument();
xmlDoc.PreserveWhitespace = true;...
61 просмотров
schedule
27.10.2021
Указание сегодняшней даты в XML-файле
Я новичок в файлах XML в целом, и мне нужна помощь, чтобы вставить сегодняшнюю дату в мой файл для импорта в планировщик задач. Я экспортировал задачу, которую мне нужно будет запустить на нескольких компьютерах в ближайшем будущем, но она сохраняет...
601 просмотров
schedule
07.09.2021
PHP - как обрабатывать строку HTML в кодировке utf-16, us-ascii для правильного сохранения в DomDocument?
Я работаю над проектом PHP, который получает электронные письма и отображает их на экране. В электронном письме он получает следующий HTML-код:
<html>
<head>
<META http-equiv="Content-Type" content="text/html;...
105 просмотров
schedule
14.09.2021
Проблемы спецификации Java 11 UTF-16 с com.sun.org.apache.xerces.internal.impl.XMLStreamReaderImpl
У меня есть XML-файл UTF-16:
<?xml version="1.0" encoding="utf-16" standalone="yes"?>
Начинается с спецификации FE FF.
Перенося свой код на Java 11, я получаю:
Caused by: javax.xml.stream.XMLStreamException: ParseError at...
476 просмотров
schedule
15.09.2021
Отображение эмодзи UTF-8 в Java
Скажем, у меня есть смайлик ???? (дьявол).
В 4-байтовом UTF-8 это выглядит так: \u00f0\u009f\u0098\u0088
Однако в Java он будет печатать правильно только так: \ud83d\ude08
Как мне перейти от первого ко второму?
ОБНОВЛЕНИЕ 2
Ответ...
1263 просмотров
schedule
10.11.2021
Как заставить Delphi 2006 TStringList.LoadFromFile загружать файлы UTF-16
У меня есть приложение Delphi 2006, в которое я добавляю код для обработки некоторых сгенерированных файлов данных CSV. TStringList.LoadFromFile давал странные результаты, и я только что выяснил, что файлы закодированы в UTF-16.
Обновление до XE...
4187 просмотров
schedule
19.02.2022
в swift, как суррогатная пара utf16 представлена в бите
В настоящее время я изучаю Swift, используя язык быстрого программирования книги 3.1.
В книге указано, что типы Swift String и Character полностью совместимы с юникодом, причем каждый символ представлен 21-битным скалярным значением юникода....
299 просмотров
schedule
20.02.2022
Как Java хранит символы UTF-16 в своем 16-битном типе char?
Согласно спецификации Java SE 7 , Java использует стандарт Unicode UTF-16 для представления символов. Если представить String как простой массив из 16-битных переменных, каждая из которых содержит по одному символу, жизнь проста.
К сожалению,...
10286 просмотров
schedule
28.02.2022
Разница между Mac и Linux iconv от UTF16 до UTF8
Я уверен, что это одно из тех странных различий между Linux и Mac. В Linux я могу преобразовать файл с кодировкой UTF-16 в файл с кодировкой UTF-8, выполнив:
iconv -f UTF-16 -t UTF-8 /tmp/geocache_visits.txt >...
1564 просмотров
schedule
27.02.2022
Какой смысл в UTF-16?
Я никогда не понимал смысла кодировки UTF-16. Если вам нужно иметь возможность обрабатывать строки как произвольный доступ (т. е. кодовая точка совпадает с кодовой единицей), вам нужна UTF-32, поскольку UTF-16 по-прежнему имеет переменную длину....
17279 просмотров
schedule
22.03.2022
Получить необработанные двоичные данные из значения атрибута XML, проанализированного с помощью SAX в Java
Я разбираю XML-документ, содержащий текстовые строки, полученные из различных входных текстовых файлов без информации об их кодировке, которые хранятся как значения атрибутов. Сам XML-документ создается с определенной кодировкой, но текстовые строки...
916 просмотров
schedule
20.03.2022
Java 8 UTF-16 не является кодировкой по умолчанию, а UTF-8
Я немного кодировал с помощью String в Java8, Java 11, но этот вопрос основан на Java 8. У меня есть этот небольшой фрагмент.
final char e = (char)200;//È
Я просто думал, что символы между 0,255 [Ascii + расширенный Ascii] всегда будут...
808 просмотров
schedule
31.03.2022
Следует ли мне перейти с UTF-8 на UTF-16, чтобы использовать китайские символы в моем HTML?
Я использую ASP.NET MVC, MS SQL и IIS. У меня есть несколько пользователей, которые использовали китайские иероглифы в информации своего профиля. Однако, когда я показываю эту информацию, она отображается как...
33495 просмотров
schedule
15.04.2022
Perl: открыть выходной файл с тем же порядком байтов, что и входной файл — UTF-16be против UTF-16le
Когда Perl открывает файл в кодировке UTF-16,
open my $in, "< :encoding(UTF-16)", "text-utf16le.txt" or die "Error $!\n";
он автоматически определяет порядок байтов благодаря Знак порядка следования байтов .
Но когда я открываю файл...
119 просмотров
schedule
24.04.2022
Преобразование wchar_t* в строку UTF-16
Мне нужен код на C++ для преобразования строки, заданной в wchar_t* , в строку UTF-16. Он должен работать как в Windows, так и в Linux. Я просмотрел много веб-страниц во время поиска, но тема мне так и не ясна.
Как я понимаю нужно:
Вызовите...
8602 просмотров
schedule
01.05.2022