unicode 第4页 - IT屋-程序员软件开发技术分享社区

测量包含宽字符的字符串的长度

我有以下字符串：友𠂇又对应的UTF-16表示(小端) CB 53 40 D8 87 DC C8 53 \___/ \_________/ \___/ 友𠂇又 "友𠂇又".Length返回4，因为CLR将字符串存储为4个2字节字符。如何测量我的弦的长度？如何将其拆分为{ "友", "𠂇", "又" }？推荐答案 A ..

发布时间：2022-06-21 21:21:06 c# silverlight unicode split C#/.NET

从Delphi字符串检测和检索代码点和代理

我正在努力更好地理解代理项对和Delphi中的Unicode实现。如果我在Delphi中对unicode字符串S：=‘Ĥà̲V̂e’调用Long()，我将返回，8。这是因为各个字符[Ĥ]、[à̲]、[V̂]和[e]的长度分别为2、3、2和1。这是因为Ĥ有一个代理，一个̲̀有两个额外的代理，V̂有一个代理，而e没有代理。如果我想返回字符串中的第二个元素，包括所有代理，[ ..

发布时间：2022-06-21 16:12:06 delphi unicode surrogate-pairs 其他开发

为什么现代Perl在默认情况下避免使用UTF-8？

我想知道为什么大多数使用Perl构建的现代解决方案在默认情况下不启用UTF-8。我知道核心Perl脚本有许多遗留问题，在这些问题上它可能会破坏一些东西。但是，在我看来，在21世纪st世纪，大型的新项目(或有远见的项目)应该从零开始对他们的软件进行UTF-8验证。尽管如此，我仍认为这不会发生。例如，Moose启用严格和警告，但不启用Unicode。Modern::Perl也减少了样板，但没有 ..

发布时间：2022-06-21 13:54:48 perl unicode utf-8 其他开发

对于单个Unicode字符串，Python返回的长度为2

在Python2.7中： In [2]: utf8_str = 'xf0x9fx91x8d' In [3]: print(utf8_str) 👍 In [4]: unicode_str = utf8_str.decode('utf-8') In [5]: print(unicode_str) 👍 In [6]: unicode_str Out[6]: u'U0001f44d' In [ ..

发布时间：2022-06-21 12:30:25 python python-2.7 unicode python-unicode Python

如何从字符串中删除表情符号

我的问题是使用正则表达式从字符串中删除emoji，而不是从字符串中删除CJK(中文、日语、韩语)字符。我尝试使用此正则表达式： REGEX = /[^u1F600-u1F6FFs]/i 这个正则表达式工作得很好，只是它还可以检测我需要的中文、日文和韩文字符。你知道如何解决这个问题吗？推荐答案 Karol S已提供a solution，但原因可能不清楚： "u1F600 ..

发布时间：2022-06-20 23:08:51 ruby regex unicode emoji 其他开发

如何在Python中将代理项对转换为普通字符串？

这是Converting to Emoji的后续内容。在这个问题中，OP有一个json.dumps()编码的文件，其中一个表情符号表示为一个代理对-ud83dude4f。他/她在读取文件和正确翻译表情符号时遇到问题，正确的answer是json.loads()文件中的每一行，json模块将处理从代理项对返回到(我假设是UTF8编码的)表情符号的转换。我的情况是这样的：假设我只有一个带有代理 ..

发布时间：2022-06-20 21:25:59 python python-3.x unicode surrogate-pairs Python

UTF-8字符有问题；我看到的不是我存储的内容

我尝试使用UTF-8，但遇到了问题。我尝试了很多方法，以下是我得到的结果： ????而不是亚洲字符。即使是欧洲文本，我也得到了Señor。奇怪的胡言乱语(Mojibake？)例如SeÃ±or或æ–°æµªæ–°é—»。黑色钻石，如Se�或. 最后，我遇到了数据丢失或至少被截断的情况：SeforSeñor。即使我将文本放在外观正确时，它也无法正确地排序。我做错了什 ..

发布时间：2022-06-20 20:02:33 mysql unicode utf-8 character-encoding mariadb 数据库

PHP7：Unicode转义语法不适用于单引号

只要使用单引号设置字符串，Unicode就不会被解码，但是当使用双引号设置时，Unicode就会被解码。如何也对单引号设置的字符串进行解码？ PHP $poo = 'u{1F6BB}'; echo $poo; $poo = "u{1F6BB}"; echo $poo; 输出 u{1F6BB}🚻 示例 http://sandbox.onlinephpfun ..

发布时间：2022-06-16 12:23:03 php string unicode php-7 PHP

与区域指示符字符类匹配的python正则表达式

我在Mac上使用的是python2.7.10。表情符号中的标志用一对Regional Indicator Symbols表示。我想编写一个python正则表达式来在一串emoji标志之间插入空格。例如，此字符串是两个巴西国旗： u"U0001F1E7U0001F1F7U0001F1E7U0001F1F7" 将呈现如下：🇧🇷🇧🇷 我想在任何一对区域指示器符号之间插 ..

发布时间：2022-06-11 13:00:22 python regex unicode python-2.x regional Python

从Unicode字符串中正确提取表情符号

我使用的是Python2，我有一个包含表情符号以及其他Unicode字符的字符串。我需要将其转换为列表，其中列表中的每个条目都是单个字符/表情符号。 x = u'😘😘xyz😊😊' char_list = [c for c in x] 所需输出为： ['😘', '😘', 'x', 'y', 'z', '😊', '😊'] 实际输出为： [u'ud83d', u ..

发布时间：2022-06-11 11:36:32 python unicode python-2.x emoji Python

我可以在JSON模式模式(正则表达式)中使用Unicode标志吗？

是否可以设置u标志从而启用Unicode正则表达式模式？我需要匹配Straßer、Müller、Adèle、Yiğit之类的名称。如果我可以在JSON架构中使用纯JS，/p{L}+/u或new RegExp('\p{L}+', 'u')将适用于我的情况。 specification表示 6.3.3。模式此关键字的值必须为字符串。根据ECMA-262正则表达式方言，此 ..

发布时间：2022-06-09 20:39:02 json regex unicode jsonschema letter 其他开发

不区分大小写的存储和Unicode兼容性

听说我的工作中有人使用String.toLowerCase()将不区分大小写的代码存储在数据库中以供搜索，我有epic fail的时间思考它可能出错的方式：土耳其测试(特别是在运行的计算机上更改区域设置) Unicode version upgrades-我的意思是，谁知道这些东西？如果我升级到Java 7，如果我不区分大小写，我必须重新索引我的数据？ Unicode版本会影响哪些 ..

发布时间：2022-06-06 10:57:00 unicode compatibility 其他开发

仅在某些情况下，MySQL才返回不正确的UTF8扩展字符

注意：在下面的问题中，您可能会看到？或块而不是字符，这是因为您没有适当的字体。请忽略此操作。背景我有一个表，其中的数据结构如下： CREATE TABLE `decomposition_dup` ( `id` int(11) NOT NULL AUTO_INCREMENT, `parent` varchar(50) COLLATE utf8mb4_unicode_ci N ..

发布时间：2022-05-23 22:24:19 mysql unicode sql-like cjk utf8mb4 数据库

如何在文本视图中设置Unicode表情符号？

您好，我想做以下事情： ??? unicode = U+1F60A String emoji = getEmojiByUnicode(unicode) String text = "So happy " textview.setText(text + emoji); 要在我的文本视图中获取此内容：快乐的😊 如何实现getEmojiByUnicode(unicode)？ ..

发布时间：2022-05-19 09:31:07 android unicode textview encode emoji 移动开发

在PHP中根据W3C规范Unicode

在W3C validator中验证我的网站的HTML代码时，收到以下警告： Line 157, Column 220: Text run is not in Unicode Normalization Form C. …i͈̭̋ͥ̂̿̄̋̆ͣv̜̺̋̽͛̉͐̀͌̚e͖̼̱ͣ̓ͫ͆̍̄̍͘-̩̬̰̮̯͇̯͆̌ͨ́͌ṁ̸͖̹͎̱̙̱͟͡i̷̡͌͂͏̘̭̥̯̟n̏͐͌̑̄̃͘͞… 我在PH ..

发布时间：2022-05-18 15:32:34 php unicode normalization web-standards unicode-normalization PHP

是否有Unicode字形符号来表示搜索

Unicode有一百万个类似图标的字形，但它们很难搜索。有没有看起来像双目或放大镜的Unicode字形？或者，有没有一个符号用来表示Unicode中的“搜索”？推荐答案有U+1F50D LEFT-POINTING MAGNIFYING GLASS(🔍)和U+1F50E RIGHT-POINTING MAGNIFYING GLASS(🔎)。您应该使用(在HTML ..

发布时间：2022-04-19 22:08:12 unicode symbols html-entities 其他开发

如何将包含Unicode代理项对的JSON编码数据转换为字符串？

因此，我正在尝试使用Unicode指示器的数据，并将其打印为表情符号。它目前在txt中。文件，但我稍后会写入到EXCEL文件。所以不管怎样，我收到了一个错误，我不确定该如何处理。这是我正在阅读的文本： "Thanks @UglyGod ud83dude4f https:\/\/t.co\/8zVVNtv1o6" "RT @Rosssen: Multiculti beatdown ud83du ..

发布时间：2022-04-18 15:05:01 python unicode python-3.5 emoji Python

RichTextBox无法显示Unicode数学字母数字符号

我无法让WinFormsRichTextBox显示某些Unicode字符，特别是Mathematical alphanumeric symbols(但问题很可能不限于这些字符)。令人惊讶的是，相同的字符可以使用相同的(默认)字体以纯字体或多行TextBox显示。即使我将字体更改为例如“Arial”或“Lucida”，我也会得到相同的结果。该屏幕截图来自Windows 10，但我在Win ..

发布时间：2022-04-17 20:18:22 c# .net winforms unicode richtextbox C#/.NET

Unicode转换为字符串会留下前导字节顺序标记

在.NET 3.5 C#应用程序中，我正在将Unicode编码的字节数组转换为字符串。字节数组如下： {255, 254, 85, 0, 83, 0, 69, 0} 使用Encoding.Unicode.GetString(var)，我将字节数组转换为字符串，它返回： {65279 '', 85 'U', 83 'S' , 69 'E'} 前导字符65279似乎是Zer ..

发布时间：2022-04-15 18:33:27 c# unicode character-encoding c#-3.0 byte-order-mark C#/.NET

防止将字符绘制为表情符号

我要使用drawText()将单个Unicode字符绘制到画布上。 canvas.drawText("u270cufe0e", x, y, paint); 在运行Android 7的测试设备上，它正确显示：但在我的模拟器“运行”Android 6中，以及在运行Android 6的实际设备上，它被绘制为Emoji，而不考虑ufe0e：这当然不是我想要的，因为我想把它画成黑色 ..

发布时间：2022-04-15 11:19:13 android unicode android-canvas draw emoji 移动开发

unicode相关内容