unicode相关内容

测量包含宽字符的字符串的长度

我有以下字符串: 友𠂇又 对应的UTF-16表示(小端) CB 53 40 D8 87 DC C8 53 \___/ \_________/ \___/ 友 𠂇 又 "友𠂇又".Length返回4,因为CLR将字符串存储为4个2字节字符。 如何测量我的弦的长度?如何将其拆分为{ "友", "𠂇", "又" }? 推荐答案 A ..
发布时间:2022-06-21 21:21:06 C#/.NET

从Delphi字符串检测和检索代码点和代理

我正在努力更好地理解代理项对和Delphi中的Unicode实现。 如果我在Delphi中对unicode字符串S:=‘Ĥà̲V̂e’调用Long(),我将返回,8。 这是因为各个字符[Ĥ]、[à̲]、[V̂]和[e]的长度分别为2、3、2和1。这是因为Ĥ有一个代理,一个̲̀有两个额外的代理,V̂有一个代理,而e没有代理。 如果我想返回字符串中的第二个元素,包括所有代理,[ ..
发布时间:2022-06-21 16:12:06 其他开发

为什么现代Perl在默认情况下避免使用UTF-8?

我想知道为什么大多数使用Perl构建的现代解决方案在默认情况下不启用UTF-8。 我知道核心Perl脚本有许多遗留问题,在这些问题上它可能会破坏一些东西。但是,在我看来,在21世纪st世纪,大型的新项目(或有远见的项目)应该从零开始对他们的软件进行UTF-8验证。尽管如此,我仍认为这不会发生。例如,Moose启用严格和警告,但不启用Unicode。Modern::Perl也减少了样板,但没有 ..
发布时间:2022-06-21 13:54:48 其他开发

如何从字符串中删除表情符号

我的问题是使用正则表达式从字符串中删除emoji,而不是从字符串中删除CJK(中文、日语、韩语)字符。我尝试使用此正则表达式: REGEX = /[^u1F600-u1F6FFs]/i 这个正则表达式工作得很好,只是它还可以检测我需要的中文、日文和韩文字符。你知道如何解决这个问题吗? 推荐答案 Karol S已提供a solution,但原因可能不清楚: "u1F600 ..
发布时间:2022-06-20 23:08:51 其他开发

如何在Python中将代理项对转换为普通字符串?

这是Converting to Emoji的后续内容。在这个问题中,OP有一个json.dumps()编码的文件,其中一个表情符号表示为一个代理对-ud83dude4f。他/她在读取文件和正确翻译表情符号时遇到问题,正确的answer是json.loads()文件中的每一行,json模块将处理从代理项对返回到(我假设是UTF8编码的)表情符号的转换。 我的情况是这样的:假设我只有一个带有代理 ..
发布时间:2022-06-20 21:25:59 Python

UTF-8字符有问题;我看到的不是我存储的内容

我尝试使用UTF-8,但遇到了问题。 我尝试了很多方法,以下是我得到的结果: ????而不是亚洲字符。即使是欧洲文本,我也得到了Señor。 奇怪的胡言乱语(Mojibake?)例如Señor或新浪新闻。 黑色钻石,如Se�或. 最后,我遇到了数据丢失或至少被截断的情况:SeforSeñor。 即使我将文本放在外观正确时,它也无法正确地排序。 我做错了什 ..
发布时间:2022-06-20 20:02:33 数据库

PHP7:Unicode转义语法不适用于单引号

只要使用单引号设置字符串,Unicode就不会被解码,但是当使用双引号设置时,Unicode就会被解码。 如何也对单引号设置的字符串进行解码? PHP $poo = 'u{1F6BB}'; echo $poo; $poo = "u{1F6BB}"; echo $poo; 输出 u{1F6BB}🚻 示例 http://sandbox.onlinephpfun ..
发布时间:2022-06-16 12:23:03 PHP

与区域指示符字符类匹配的python正则表达式

我在Mac上使用的是python2.7.10。 表情符号中的标志用一对Regional Indicator Symbols表示。我想编写一个python正则表达式来在一串emoji标志之间插入空格。 例如,此字符串是两个巴西国旗: u"U0001F1E7U0001F1F7U0001F1E7U0001F1F7" 将呈现如下:🇧🇷🇧🇷 我想在任何一对区域指示器符号之间插 ..
发布时间:2022-06-11 13:00:22 Python

从Unicode字符串中正确提取表情符号

我使用的是Python2,我有一个包含表情符号以及其他Unicode字符的字符串。我需要将其转换为列表,其中列表中的每个条目都是单个字符/表情符号。 x = u'😘😘xyz😊😊' char_list = [c for c in x] 所需输出为: ['😘', '😘', 'x', 'y', 'z', '😊', '😊'] 实际输出为: [u'ud83d', u ..
发布时间:2022-06-11 11:36:32 Python

我可以在JSON模式模式(正则表达式)中使用Unicode标志吗?

是否可以设置u标志从而启用Unicode正则表达式模式? 我需要匹配Straßer、Müller、Adèle、Yiğit之类的名称。 如果我可以在JSON架构中使用纯JS,/p{L}+/u或new RegExp('\p{L}+', 'u')将适用于我的情况。 specification表示 6.3.3。模式 此关键字的值必须为字符串。根据ECMA-262正则表达式方言,此 ..
发布时间:2022-06-09 20:39:02 其他开发

不区分大小写的存储和Unicode兼容性

听说我的工作中有人使用String.toLowerCase()将不区分大小写的代码存储在数据库中以供搜索,我有epic fail的时间思考它可能出错的方式: 土耳其测试(特别是在运行的计算机上更改区域设置) Unicode version upgrades-我的意思是,谁知道这些东西?如果我升级到Java 7,如果我不区分大小写,我必须重新索引我的数据? Unicode版本会影响哪些 ..
发布时间:2022-06-06 10:57:00 其他开发

是否有Unicode字形符号来表示搜索

Unicode有一百万个类似图标的字形,但它们很难搜索。 有没有看起来像双目或放大镜的Unicode字形? 或者,有没有一个符号用来表示Unicode中的“搜索”? 推荐答案 有U+1F50D LEFT-POINTING MAGNIFYING GLASS(🔍)和U+1F50E RIGHT-POINTING MAGNIFYING GLASS(🔎)。 您应该使用(在HTML ..
发布时间:2022-04-19 22:08:12 其他开发

如何将包含Unicode代理项对的JSON编码数据转换为字符串?

因此,我正在尝试使用Unicode指示器的数据,并将其打印为表情符号。它目前在txt中。文件,但我稍后会写入到EXCEL文件。所以不管怎样,我收到了一个错误,我不确定该如何处理。这是我正在阅读的文本: "Thanks @UglyGod ud83dude4f https:\/\/t.co\/8zVVNtv1o6" "RT @Rosssen: Multiculti beatdown ud83du ..
发布时间:2022-04-18 15:05:01 Python

RichTextBox无法显示Unicode数学字母数字符号

我无法让WinFormsRichTextBox显示某些Unicode字符,特别是Mathematical alphanumeric symbols(但问题很可能不限于这些字符)。 令人惊讶的是,相同的字符可以使用相同的(默认)字体以纯字体或多行TextBox显示。即使我将字体更改为例如“Arial”或“Lucida”,我也会得到相同的结果。 该屏幕截图来自Windows 10,但我在Win ..
发布时间:2022-04-17 20:18:22 C#/.NET

防止将字符绘制为表情符号

我要使用drawText()将单个Unicode字符绘制到画布上。 canvas.drawText("u270cufe0e", x, y, paint); 在运行Android 7的测试设备上,它正确显示: 但在我的模拟器“运行”Android 6中,以及在运行Android 6的实际设备上,它被绘制为Emoji,而不考虑ufe0e: 这当然不是我想要的,因为我想把它画成黑色 ..
发布时间:2022-04-15 11:19:13 移动开发