utf-16相关内容

如何将 UTF8 字符串转换为 UTF16

我通过处理客户端应用程序发送的请求来获取 UTF8 字符串.但是字符串确实是UTF16.我该怎么做才能将它放入我的本地字符串中是一个字母后跟 \0 字符?我需要将该字符串转换为 UTF16. 接收字符串示例:S\0a\0m\0p\0l\0e (UTF8). 我想要的是:Sample (UTF16) FileItem item = (FileItem) iter.next();字符串字段 ..
发布时间:2021-09-15 19:38:30 Java开发

Python 2.7 中特定于平台的 Unicode 语义

Ubuntu 11.10: $ pythonPython 2.7.2+(默认,2011 年 10 月 4 日,20:03:08)[GCC 4.6.1] 在 linux2输入“帮助"、“版权"、“信用"或“许可"以获取更多信息.>>>x = u'\U0001f44d'>>>长度(x)1>>>顺序(x[0])128077 Windows 7: Python 2.7.2(默认,2011 年 6 月 ..
发布时间:2021-09-15 19:38:27 Python

在 python 中查找 utf-16 文件.如何?

由于某种原因,我无法找到我的 utf16 文件.它产生“UnicodeException:UTF-16 流不以 BOM 开头".我的代码: f = codecs.open(ai_file, 'r', 'utf-16')seek = self.ai_map[self._cbClass.Text] #seek 是有效的 intf.seek(寻求)为真:ln = f.readline().strip( ..
发布时间:2021-09-15 19:38:24 Python

VBA 使用 UTF-16 输出到文件

我有一个非常复杂的问题,很难正确解释.互联网上有很多关于这个的讨论,但没有一个明确的.任何帮助,或比我更好的解释,非常感谢. 本质上,我只是尝试使用 UTF-16 和 VBA 编写一个 XML 文件. 如果我这样做: sXML = " 如果你绝对必须有 UTF-8,你可以自己做一些: 选项显式私有声明函数 WideCharToMultiByte Lib "kernel32.dll ..
发布时间:2021-09-15 19:38:21 其他开发

“UTF-16"和“UTF-16"有什么区别?和“std::wstring"?

这两种字符串存储格式有什么区别吗? 解决方案 std::wstring 是 wchar_t 的容器.wchar_t 的大小没有指定——Windows 编译器倾向于使用 16 位类型,Unix 编译器倾向于使用 32 位类型. UTF-16 是一种在16 位整数. 使用 Visual Studio,如果您使用不包含 BMP,你最终会得到 UTF-16,但这两个概念大多是无关的.如 ..
发布时间:2021-08-30 19:19:14 C/C++开发

在 SQL Server 中存储 UTF-16/Unicode 数据

根据this,SQL Server 2K5使用UCS-2 内部.它可以将 UTF-16 数据存储在 UCS-2 中(具有适当的数据类型、nchar 等),但是如果有补充字符,则将其存储为 2 个 UCS-2 字符. 这给字符串函数带来了明显的问题,即 SQL Server 将 1 个字符视为 2. 我有点惊讶 SQL Server 基本上只能处理 UCS-2,甚至在 SQL 2K8 中 ..
发布时间:2021-08-25 19:54:47 数据库

是否有带有 UTF-16 字符串类型的 Rust 库?(用于编写 Javascript 解释器)

对于大多数程序,最好在内部使用 UTF-8,并且在必要时, 转换为其他编码.但就我而言,我想编写一个 Javascript 解释器,并且只存储 UTF-16 字符串(或 u16 的数组)要简单得多,因为 我需要单独处理 16 位代码单元(这通常是一个坏主意,但 Javascript 需要这样做).这意味着我需要它来实现 Index. 我需要存储不成对的代理,即格式错误的 UTF-16 ..
发布时间:2021-07-13 21:30:07 其他开发

如何将 Rust 字符串转换为 UTF-16?

编者注:此代码示例来自 Rust 1.0 之前的版本,不是有效的 Rust 1.0 代码,但答案仍包含有价值的信息. 我想将字符串文字传递给 Windows API.许多 Windows 函数使用 UTF-16 作为字符串编码,而 Rust 的原生字符串是 UTF-8. 我知道 Rust 有 utf16_units() 生成 UTF-16 字符迭代器,但我不知道如何使用该函数生成最后一 ..
发布时间:2021-07-13 20:50:33 其他开发

Java Swing - JTextField/JTextArea 无法粘贴补充 unicode 字符

我已经对 stackoverflow 和 Google 进行了详尽的搜索,但到目前为止我还没有找到其他有类似问题的人. 在示例 Java Swing 测试程序中,我创建了一个普通的 JTextField,以便我可以尝试将字符从网页 (http://isthisthingon.org/unicode/) 粘贴到其中.当我用'㓿'(代码点13567)测试时,它能够粘贴字符.此字符是 CJK 表意 ..
发布时间:2021-06-14 20:06:09 其他开发

在node.js应用程序中读取文件时出现奇怪的unicode字符

我正在尝试编写一个节点应用程序,该应用程序读取一组文件,将它们拆分为几行,然后将这些行放入数组中.很简单除了我正在使用的某些SQL文件外,它还可以处理许多文件.出于某种原因,当我拆分行时,似乎会得到某种unicode输出.该应用看起来像这样: fs = require("fs");var data = fs.readFileSync("test.sql","utf8");console.log ..
发布时间:2021-05-19 19:31:24 前端开发

编码UTF-16之后,如果要在iTextSharp中使用,则字符串会损坏

首先,我从文本文件中获取一些信息,然后将这些信息添加到pdf文件的元数据中.在“生产者"部分中,发生了土耳其语字符ğ,ş的错误.我通过使用 UTF-16 这样解决了这个问题: write.Info.Put(新PdfName(“生产者"),新PdfString("AnkaraÜniversitesiHukukFakültesiDergisi(AÜHFD),C.59,S.2,y.2010,s.30 ..
发布时间:2021-05-04 19:21:27 数据库

为什么在UTF-16和UTF-32编码的情况下必须指定BOM

我不太了解UTF编码和BOM的原理. 如果计算机已经知道如何将多字节数据类型(例如,大小为4字节的整数)组成一个变量,那么在UTF-16和UTF-32中使用BOM的意义何在?为什么我们需要为这些编码显式指定它? 为什么我们不需要为UTF-8指定它呢?Unicode标准说它是“面向字节的",但是即使那样,我们仍然需要知道它是否是编码代码点的第一个字节.还是在每个字符的前/后位中指定了它? ..
发布时间:2021-05-04 19:21:18 其他开发

使用替换Java中的无效字符将UTF8字符串转换为UCS-2

我对UTF8有一种感觉: “Red🌹🌹Röses" 我需要将其转换为有效的UCS-2(或没有BOM的固定大小的UTF-16BE,它们是相同的东西)编码,因此输出将是:“红色玫瑰"作为“🌹"超出UCS-2的范围. 我尝试过的事情: @Test公共无效的testEncodeProblem()抛出CharacterCodingException {字符串="Red \ uD8 ..
发布时间:2021-05-04 19:20:45 其他开发

如何在utf-16中编码JavaScript字符串?

在Python 3中,我可以这样做: >>>“€13,56" .encode('utf-16')b'\ xff \ xfe \ xac 1 \ x003 \ x00,\ x005 \ x006 \ x00' 输入是一个(unicode)字符串,而输出是该字符串的原始字节序列,该字符串以utf-16编码. 如何在JavaScript中做同样的事情-从一个(unicode)字符串转换为以u ..
发布时间:2021-05-04 19:15:53 前端开发

如何在python ctypes中使用UTF-16?

我有一个外国C库,该库在API中使用utf-16:作为函数参数,返回值和结构成员. 在Windows上使用ctypes.c_wchar_p可以,但是在OSX下ctypes在c_wchar中使用UCS-32,我找不到支持utf-16的方法. 这是我的研究 使用_SimpleCData子类化来重新定义_check_retval_ . 它允许将utf-16透明转换为Python字 ..
发布时间:2021-04-27 20:01:28 Python

如何在python中解码从文件读取的unicode字符串?

我有一个包含UTF-16字符串的文件.当我尝试读取unicode时,""(双引号)被添加,该字符串看起来像"b'\\ xff \\ xfeA \\ x00'" .内置的 .decode 函数引发 AttributeError:'str'对象没有属性'decode'.我尝试了一些选项,但这些选项无效. 这就是我正在读取的文件的样子 解决方案 看起来文件是通过向其写入字节文字而创建的,如 ..
发布时间:2021-04-21 20:27:24 Python