utf-16相关内容

如何将表情符号与R正则表达式匹配?

我想确定我的向量中包含表情符号的元素: x = c('😂', 'no', '🍹', '😀', 'no', '😛', '䨺', '감사') x # [1] "U0001f602" "no" "U0001f379" "U0001f600" "no" "U0001f61b" "䨺" "감사" 相关帖子只涉及其他语言,因为它们大多指的是专业 ..
发布时间:2022-09-21 23:32:33 其他开发

Java Swing-JTextfield/JTextArea无法粘贴补充的Unicode字符

我已经对Stackoverflow和Google进行了详尽的搜索,但到目前为止还找不到其他有类似问题的人。 在一个样例Java Swing测试程序中,我创建了一个普通的JTextfield,以便尝试从网页(http://isthisthingon.org/unicode/).)将字符粘贴到其中当我用‘㓿’(代码点13567)测试时,它能够粘贴字符。此字符是中日韩表意文字扩展A平面中列出的最后一个 ..
发布时间:2022-09-06 19:54:28 Java开发

使用PHP将&;#55357;&;#56911;转换为Html中的Emoji

我们有一堆代理项对(或2字节UTF8?)像��这样的字符,这是祈祷手表情符号,存储为UTF8作为2个字符。在浏览器中呈现时,此字符串呈现为两个?? 示例:�;�; 我需要使用php将它们转换为HANDS emjoi,但我就是找不到iconv、utf8_decode、html_Entity_decode等的组合来实现它。 此站点正 ..
发布时间:2022-04-11 18:04:09 PHP

什么是Unicode、UTF-8和UTF-16?

Unicode的基础是什么?为什么需要UTF-8或UTF-16? 我在谷歌上研究过这一点,也在这里搜索过,但我不清楚。 在VSS中,进行文件比较时,有时会出现两个文件的UTF不同的消息,为什么会这样? 请简单解释。 unicode 为什么需要推荐答案? 在早期(不是太早),所有存在的都是ASCII。这很好,因为所需要的只是几个控制字符、标点符号、数字和字母,就像这句话 ..
发布时间:2022-02-21 22:20:03 其他开发

在 .Net 中使用大于 2 个字节的 unicode 字符

我正在使用此代码生成 U+10FFFC var s = Encoding.UTF8.GetString(new byte[] {0xF4,0x8F,0xBF,0xBC}); 我知道它是供私人使用的,但它确实显示了一个字符,正如我在显示它时所期望的那样.操作此 Unicode 字符时会出现问题. 如果我以后这样做: foreach(var ch in s){Console.WriteLi ..
发布时间:2022-01-12 20:29:08 C#/.NET

utf8_general_ci 或 utf8mb4 还是...?

utf16 还是 utf32?我正在尝试以多种语言存储内容.一些语言使用双宽字体(例如,日文字体通常是英文字体的两倍).我不确定我应该使用哪种数据库.有关这四个字符集之间差异的任何信息... 解决方案 MySQL的utf32和utf8mb4(以及标准的UTF-8)可以直接存储指定的任意字符通过 Unicode;前者的大小固定为每个字符 4 个字节,而后者的大小在每个字符 1 到 4 个字节 ..
发布时间:2022-01-11 11:11:19 其他开发

将 C++ std::string 转换为 UTF-16-LE 编码的字符串

我今天已经搜索了几个小时,但找不到任何适合我的东西.我刚刚看过的一个,没有运气,是“如何将 UTF-8 编码的 std::string 转换为 UTF-16 std::string". 我的问题是,简要说明: 我想在 std C++ 中创建一个有效的 NTLM 哈希,并且我正在使用 OpenSSL 的库来使用其 MD4 例程创建哈希.我知道怎么做,那么有谁知道如何将 std::stri ..
发布时间:2022-01-07 21:38:23 C/C++开发

在 SQL Server 2008 的 NVarChar 中存储 UTF-8 时遇到问题

我正在使用 System.Net.WebClient 从网站中提取数据,当数据返回时,除了带重音的字母外,所有内容都会解析并看起来不错.例如,当它返回一个 é 时,SQL Server 2008 将其保存为 é. 只需要弄清楚如何将这些 UTF-8 字符转换为 SQL Server 可以读取的内容.我将它存储在 NVARCHAR(MAX) 数据类型中. 如果您好奇,我正在使用 Lin ..
发布时间:2022-01-07 16:01:00 C#/.NET

utfcpp 和 Win32 宽 API

使用微小的 utfcpp 库来转换我从中获得的所有内容是否好/安全/可能使用 utf16to8 将广泛的 Windows API(FindFirstFileW 等)转换为有效的 UTF8 表示? 我想在内部使用 UTF8,但无法获得正确的输出(在另一次转换后通过 wcout 或普通 cout).正常的 ASCII 字符当然可以工作,但 ñä 会搞砸. 或者有更简单的选择吗? 谢谢 ..
发布时间:2021-12-28 16:59:47 C/C++开发

为什么 Java 字符使用 UTF-16?

最近我阅读了很多关于 Unicode 代码点以及它们如何随时间演变的内容,并且确定我阅读了 http://www.joelonsoftware.com/articles/Unicode.html 这也是. 但我找不到真正的原因是为什么 Java 使用 UTF-16 作为字符. 例如,如果我有一个包含 1024 个字母的 ASCII 范围字符串的字符串.这意味着 1024 * 2 byt ..
发布时间:2021-12-28 16:58:56 Java开发

为什么.net 对字符串使用UTF16 编码,而使用UTF-8 作为默认保存文件?

从这里 本质上,string 使用的是 UTF-16 字符编码形式 但是当保存 vs StreamWriter 时: 这个构造函数创建了一个带有 UTF-8 编码的 StreamWriter,没有字节顺序标记 (BOM), 我看过这个示例(已删除断开的链接): 而且对于某些字符串,utf8 看起来更小,而在其他一些字符串中 utf-16 更小. 那么为什么.ne ..
发布时间:2021-12-28 16:53:33 C#/.NET

不推荐使用的标头 <codecvt>替代品

有点前景:我的任务需要将 UTF-8 XML 文件转换为 UTF-16(当然还有适当的标头).因此,我搜索了将 UTF-8 转换为 UTF-16 的常用方法,发现应该使用 中的模板. 但是现在当它已弃用时,我想知道什么是新的常用方法同样的任务? (完全不介意使用 Boost,但除此之外,我更喜欢尽可能接近标准库.) 解决方案 std::codecvt 模板来自 本身并没有被弃用 ..
发布时间:2021-12-28 16:26:22 C/C++开发

在 Python 中将带 BOM 的 UTF-8 转换为不带 BOM 的 UTF-8

这里有两个问题.我有一组文件,通常是带有 BOM 的 UTF-8.我想将它们(理想情况下)转换为没有 BOM 的 UTF-8.看起来 codecs.StreamRecoder(stream, encode, decode, Reader, Writer, errors) 会处理这个.但我真的没有看到任何关于使用的好例子.这会是处理这个问题的最好方法吗? 源文件:1 月 17 日星期二 $ 文件 ..
发布时间:2021-12-28 16:26:12 Python

Java 与 C# 中的 UTF-16 编码

我正在尝试读取 UTF-16 编码方案中的字符串并对其执行 MD5 散列.但奇怪的是,当我尝试这样做时,Java 和 C# 返回了不同的结果. 以下是Java中的一段代码: public static void main(String[] args) {String str = "preparar mantecado con coca cola";尝试 {MessageDigest 摘要 ..
发布时间:2021-12-27 15:55:37 Java开发

执行 os.walk 时出现 UnicodeDecodeError

我收到错误: 'ascii' 编解码器无法解码位置 14 中的字节 0x8b:序号不在范围内 (128) 尝试执行 os.walk 时.发生该错误是因为目录中的某些文件中包含 0x8b(非 utf8)字符.这些文件来自 Windows 系统(因此是 utf-16 文件名),但我已将文件复制到 Linux 系统并使用 python 2.7(在 Linux 中运行)来遍历目录. 我尝试将 u ..
发布时间:2021-12-27 15:42:51 Python

表情符号值范围

我试图从字符串中取出所有表情符号字符(如消毒剂).但是我找不到一套完整的表情符号值. 表情符号字符的 UTF16 值的完整集合是什么? 解决方案 Unicode 标准的 Unicode® 技术报告#51 包括表情符号列表(emoji-data.txt): ...21A9;文本 ;L1;没有任何 ;j # V1.1 (↩) 左箭头带钩21AA;文本 ;L1;没有任何 ;j # V1. ..
发布时间:2021-12-27 15:32:28 其他开发