utf-16相关内容

为什么从Unicode字符集中删除了U + D800到U + DFFF范围内的代码点?

我正在学习UTF-16编码,并且我读到如果要表示U + 10000到U + 10FFFF范围内的代码点,则必须使用代理对,范围在从U + D800到U + DFFF. 因此,假设我要对以下代码点进行编码:U + 10123(二进制为10000000100100011): 首先,我将按以下顺序排列这些位: 110110xxxxxxxxxx 110111xxxxxxxxxx 然 ..
发布时间:2021-04-21 20:23:58 其他开发

UTF-8输入有问题

我的简单代码输出时日语字符没有问题,但是由于某种原因,它不能正确输入,是否缺少某些东西? int main(){_setmode(_fileno(stdout),_O_U16TEXT);SetConsoleCP(CP_UTF8);std :: wstring s = L“こんにちは,世界!\ n你好,世界!";std :: wcout ..
发布时间:2021-04-20 19:04:01 C/C++开发

如何在C ++ 17中读取UTF-16文本文件

我对C ++很陌生.我想在Visual Studio 2019中的C ++ 17中读取UTF-16文本文件. 我已经在Internet上尝试了几种方法(包括StackOverflow),但没有一种起作用,并且其中一些没有编译(我认为它们仅支持较旧的编译器). 我正试图在不使用任何第三方库的情况下实现这一目标. 这会读取一个文本文件,但是每个字母之间都有一些奇怪的字符和空格. / ..
发布时间:2021-04-20 19:00:15 C/C++开发

是否可以将文本文件设置为UTF-16?

我的文本编写代码适用于ANSI字符,但是当我尝试编写日语字符时,它们不会出现.我需要使用UTF-16编码吗?如果是这样,我将如何在代码上做到这一点? std :: wstring文件名;std :: wstring文字;文件名=“路径";wofstream myfile;myfile.open(文件名,ios :: app);getline(wcin,text);myfile ..
发布时间:2021-04-19 20:15:05 C/C++开发

是否可以可靠地将用户文件自动解码为Unicode?[C#]

我有一个Web应用程序,允许用户上传其内容进行处理.处理引擎需要UTF8(并且我正在从多个用户的文件中编写XML),因此我需要确保可以正确解码上传的文件. 由于如果我的任何用户都知道甚至对他们的文件进行了编码,我都会感到惊讶,所以我很少希望他们能够正确地指定编码.(解码器)使用.因此,我的应用程序剩下的任务是在解码之前进行检测. 这似乎是一个普遍的问题,我很惊讶没有找到解决方案的框架功 ..
发布时间:2021-04-18 20:07:27 C#/.NET

将C ++ UTF-8/ASCII转换为MFC中的UTF-16

在将其显示在MFC程序中之前,如何将(文本)文件从UTF-8/ASCII转换为UTF-16?因为MFC每个字符使用16位,而Windows上的大多数(文本)文件使用UTF-8或ASCII. 解决方案 简单的答案称为 WideCharToMultiByte 进行反向转换.还有 CW2A 和 CA2W 使用起来更简单. 但是,我强烈建议不要直接使用这些功能.您有手动处理字符缓冲区的痛苦, ..
发布时间:2021-04-10 18:36:34 C/C++开发

确定文本文件编码架构

我正在尝试创建一种可以检测文本文件编码模式的方法.我知道那里有很多,但是我确定我的文本文件是 ASCII , UTF-8 或 UTF-16 .我只需要检测这三个即可.有人知道这样做的方法吗? 解决方案 使用StreamReader识别编码. 示例: using(var r = new StreamReader(文件名,Encoding.Default)){richtextBox1 ..
发布时间:2021-04-10 18:35:10 C#/.NET

Web API无法使用utf-16编码的XML绑定POST的模型

我有一个带有 POST 方法的简单Web API控制器,该控制器接受一个对象.当客户端以 JSON 形式发布数据时,API可以正常工作.即使使用 encoding ="utf-8" 将数据作为 XML 发送时,该模型也可以无缝绑定(我在 WebApiConfig 中添加了以下行使用 Xml序列化而不是 DataContract ) config.Formatters.XmlFormatter. ..
发布时间:2021-04-01 21:32:22 C#/.NET

SQLite-在表中插入特殊符号(商标,...)

如何在SQLite表中插入诸如商标之类的特殊符号?我尝试使用PRAGMA encoding ="UTF-16"无效:( 解决方案 问题已解决.必须使用sqlite3_open16打开数据库文件,然后执行命令PRAGMA encoding = \"UTF-16 \"; (我不确定,是否有必要).现在,插入将使用UTF-16完成. 要从db中进行选择(获取列值),必须使用sqlite3_col ..
发布时间:2020-11-29 00:39:39 数据库

为什么GIT本身不支持UTF-16

Git支持几种不同的编码方案:UTF-7,UTF-8,UTF-32以及非UTF编码方案. 鉴于此,为什么它不支持UTF-16? 有很多问题询问如何获取git以支持UTF-16,但是我认为这尚未得到明确的要求或回答. 解决方案 我花了整整一整章的大部分时间(目前相当垂死) UTF-7是一个从未出现过的标准,可能根本不应该使用(自然,较旧的Internet Explorer版本会使 ..
发布时间:2020-11-15 00:40:53 其他开发

如何在带有std库的Linux上从utf-16转换为utf-32?

在MSVC上,将utf-16转换为utf-32很容易-使用C11的 codecvt_utf16 语言环境方面.但是在GCC(gcc(Debian 4.7.2-5)4.7.2)中,似乎尚未实现此新功能.有没有一种方法可以在没有iconv的Linux上执行这种转换(最好使用std库的转换工具)? 解决方案 将UTF-16解码为UTF-32非常简单. 您可能希望在编译时检测正在使用的lib ..
发布时间:2020-11-12 22:53:37 C/C++开发

我如何使用sed linux命令处理Little-endian UTF-16文件

我正在开发有关Windows RDP的应用程序。现在,当我尝试使用sed命令直接在rdp文件中替换IP地址字符串时,我遇到了一个问题。但是执行此命令后,原始rdp文件会出现乱码。 sed -i“ s / address:s:。* / address:s:$(cat check-free-ip。 to.rdpzhitong.rdp)/“ rdpzhitong.rdp 我发现 ..
发布时间:2020-10-29 18:34:40 其他开发

在UTF-16,UTF-16BE,UTF-16LE中,UTF-16的字节序是否是计算机的字节序?

UTF-16是两字节字符编码。交换两个字节的地址将产生UTF-16BE和UTF-16LE。 但是我发现UTF-16编码的名称存在于Ubuntu gedit 文本编辑器,以及UTF-16BE和UTF-16LE。使用C测试程序,我发现我的计算机是低端字节序,并且已确认UTF-16与UTF-16LE的编码相同。 还:在小/大字节序计算机中,值(例如整数)有两个字节顺序。小型字节序计算机将在硬 ..
发布时间:2020-10-29 18:32:46 其他开发

大字节序和小字节序之间的区别

Big Endian和Little Endian字节顺序有什么区别? 这两个似乎都与Unicode和UTF16有关。 解决方案 Big-Endian(BE)/ Little-Endian(LE)是两种组织方式多字节字。例如,当使用两个字节表示UTF-16中的字符时,有两种方法将字符 0x1234 表示为字节字符串(0x00-0xFF): 字节索引:0 1 --------- ..
发布时间:2020-10-29 18:30:54 其他开发

UTF-16和UTF-8转换如何发生?

我对将Unicode字符代码点转换为UTF-16感到困惑,我正在寻找可以以最简单的方式向我解释它的人。 对于像“𐒌”这样的字符,我们得到; d801dc8c-> UTF-16 0001048c-> UTF-32 f090928c-> UTF-8 66700->十进制值 因此,UTF-16十六进制值转换为“ 11011000 00000001 11011 ..
发布时间:2020-10-29 06:41:07 其他开发

UTF-8到UTF-16LE Javascript

我需要在javascript中将utf-8字符串转换为utf-16LE,例如iconv()php函数。 即: iconv(“ UTF-8”,“ UTF-16LE”,$ string); 输出应如下所示: 49 00 6e 00 64 00 65 00 78 00 我发现这个函数可以解码UTF-16LE functio ..
发布时间:2020-10-29 06:36:12 PHP

在Windows上可以将wprintf输出正确重定向到UTF-16吗?

在C程序中,我正在使用wprintf在Windows控制台中打印Unicode(UTF-16)文本。这可以正常工作,但是当程序的输出重定向到日志文件时,日志文件的UTF-16编码已损坏。 在Windows命令提示符下完成重定向后,所有换行符都被编码为窄ASCII换行符(0d0a)。在PowerShell中完成重定向后,将插入空字符。 是否可以将输出重定向到正确的UTF-16日志文件? ..
发布时间:2020-10-29 06:29:25 其他开发