unicode 第6页 - IT屋-程序员软件开发技术分享社区

从U3数据类型转换为ASCII

我正在从.mat文件读取数据。数据的格式为Numpy数组。 [array([u'ABT'], dtype=' ..

JavaScript alt/花哨文本生成

我正在尝试了解Alt Text/花哨文本生成的工作原理。当我说Alt Text/Fight Text时，我的意思是：Text Like：𝕖𝕩𝕒𝕞𝕡𝕝𝕖 𝕥𝕖𝕩𝕥(Source) 我已经找了40分钟了，但我什么也找不到。我正在尝试用JavaScript制作一些东西，但我甚至不知道如何开始，因为我不了解它是如何生成的。我想做一个允许您将普通ASCII字符转换 ..

发布时间：2022-03-09 21:04:38 javascript unicode ascii 前端开发

将美观/艺术化的Unicode文本转换为ASCII

我有一个类似于&𝖙𝖍𝖚𝖌𝖑𝖎𝖋𝖊；的UNICODE字符串，并希望将其转换为ASCII码格式。 TUG LIFE&QOT；。我知道我可以通过在Python中实现这一点 import unidecode print(unidecode.unidecode('𝖙𝖍𝖚𝖌 𝖑𝖎𝖋𝖊')) // thug life 但是，这还会归类我要保留的其他Unicod ..

发布时间：2022-03-09 20:50:31 python-3.x unicode ascii 其他开发

如何去除红宝石中的非ASCII字符

我有一个Ruby CGI(不是Rails)，可以从Web表单中挑选照片和标题。我的用户非常热衷于使用智能引号和连字，他们是从其他来源粘贴的。我的Web应用程序不能很好地处理这些非ASCII字符，是否有快速的Ruby字符串操作例程可以清除非ASCII字符？推荐答案使用字符串#encode 从Ruby 1.9开始，在字符串编码之间进行转换的官方方式是使用String#encode ..

发布时间：2022-03-09 20:47:09 ruby unicode cgi ascii 其他开发

ISO-8859-1与UTF-8？

应该使用什么以及何时使用？或者使用UTF-8总是更好？或ISO-8859-1在特定条件下是否仍然重要？字符集是否与地理区域相关？使用代码@charset "utf-8";是否有好处？或类似在CSS文件的顶部？我为此找到的 ..

发布时间：2022-03-09 09:40:31 css xhtml unicode utf 前端开发

UTF-8：语言使用多少字节来表示可见字符？

是否有表格或类似的表格来显示当编码为UTF8时，不同语言平均需要多少字节来表示可见字符(字形)？推荐答案如果您想要一般的东西，我认为您应该坚持这样做：英语占用略多于每个字符1个字节(偶尔有非ASCII字符，通常是标点符号或符号嵌入文本)。大多数其他使用拉丁字母的语言使用的数字略高于1，但如果您期望的数字超过1.5，我会感到惊讶。使用一些其他脚本(希腊语等)的语言每个 ..

发布时间：2022-03-01 23:19:06 unicode utf-8 character byte glyph 其他开发

未知字符的字符代码-字符，例如方形或问号ROB

表示未知字符的符号的字符代码是什么？如果某个字符未包含在字体中，则它通常显示为正方形，表示该字体中不存在该符号。那个正方形符号的字符代码是什么？不是不存在的符号代码，而是实际的正方形符号？我想要UTF-8格式的字符代码。推荐答案 U+FFFD替换字符=0xEF 0xBF 0xBD ..

发布时间：2022-03-01 23:16:35 unicode character 其他开发

确定Unicode代码点是否表示来自特定脚本(如拉丁脚本)的字符？

Unicode将字符归类为属于script，例如Latin script。如何测试特定字符(code point)是否在特定脚本中？推荐答案表示枚举中的各种unicode脚本，例如包括Character.UnicodeScript.LATIN。这些与Unicode Script Properties匹配。您可以通过将字符的code point整数提交给该枚举上的of方法 ..

发布时间：2022-03-01 22:47:10 java unicode character codepoint Java开发

给定Unicode代码点的编号，如何获取该字符的字符串或CharSequence对象

我看过有关在Java中获取Unicode字符的代码点编号的问题和答案。例如，问题How can I get a Unicode character's code?。但我想要的正好相反：给定一个整数，如何获取分配给该code point数字的该字符的文本？ char原始数据类型没有任何用处，仅限于Unicode字符集的Basic Multilingual Plane。该平面表示以Unico ..

发布时间：2022-03-01 22:36:30 java unicode character codepoint Java开发

如何在Tkinter中打印非BMP Unicode字符(例如𝄫；)

注意：从Python 3.8开始，非BMP字符可以在空闲状态下显示(因此，Tkinter现在可能也会显示它们，因为它们都使用Tcl)，它是在我发布此问题一段时间后发布的。我计划在试用Python3.9之后(在安装更新版本的xubuntu之后)对此进行编辑。我还读到在IDLE中编辑这些字符可能不像其他字符那样简单；see the last comment here。所以，今天我创建了输入某些 ..

发布时间：2022-03-01 21:58:03 unicode utf-8 tkinter tcl python-3.4 其他开发

检查字符串中的唯一字符(Java)

public static boolean uniqueCheck(String s) { int checker=0,val=0; for (int i = 0; i 0) return false; ..

发布时间：2022-02-26 15:35:17 java string unicode logic logical-operators Java开发

如何使用u转义代码对Python3字符串进行编码？

在Python 3中，假设我有 >>> thai_string = 'สีเ' 使用encode可提供 >>> thai_string.encode('utf-8') b'xe0xb8xaaxe0xb8xb5' 我的问题：如何使用u而不是x让encode()返回bytes序列？我如何才能将它们decode恢复为Python 3str类型？我尝试使用ascii内置，它提供 ..

发布时间：2022-02-21 22:22:46 python python-3.x unicode unicode-escapes Python

为什么Unicode被限制为0x10FFFF？

为什么最大Unicode码位限制为0x10FFFF？是否可以通过任何编码方案(如UTF-16、UTF-8)表示此代码点以上的Unicode(例如0x10FFFF+0x000001=0x110000)？推荐答案是因为utf-16。基础多语种平面之外的字符在utf-16中用surrogate pair表示，第一个编码单元(CU)位于0xD800-0xDBFF之间，第二个编码单元位于0x ..

发布时间：2022-02-21 22:21:43 unicode character-encoding range codepoint 其他开发

什么是Unicode、UTF-8和UTF-16？

Unicode的基础是什么？为什么需要UTF-8或UTF-16？我在谷歌上研究过这一点，也在这里搜索过，但我不清楚。在VSS中，进行文件比较时，有时会出现两个文件的UTF不同的消息，为什么会这样？请简单解释。 unicode 为什么需要推荐答案？在早期(不是太早)，所有存在的都是ASCII。这很好，因为所需要的只是几个控制字符、标点符号、数字和字母，就像这句话 ..

发布时间：2022-02-21 22:20:03 unicode encoding utf-8 utf-16 其他开发

重音字符(变音符号)的具体JavaScript正则表达式

我已经查看了堆栈溢出(replacing characters.. eh、how JavaScript doesn't follow the Unicode standard concerning RegExp等)。)并且还没有真正找到问题的具体答案&JavaScript如何匹配重音字符(带有变音符号的字符)？&qot；我强制UI中的一个字段匹配格式：last_name, first_na ..

发布时间：2022-02-21 22:18:24 javascript regex unicode 前端开发

python3打印unicode到windows xp控制台编码cp437

..

发布时间：2022-01-31 20:10:50 windows python-3.x unicode printing 其他开发

UnicodeDecodeError:“charmap"编解码器无法解码位置 Y 的字节 X:字符映射到 <undefined>

我正在尝试让 Python 3 程序对一个包含信息的文本文件进行一些操作.但是，当尝试读取文件时，出现以下错误: Traceback(最近一次调用最后一次):文件“SCRIPT LOCATION"，第 NUMBER 行，在 `text = file.read()`解码中的文件“C:\Python31\lib\encodings\cp1252.py"，第 23 行`return ..

发布时间：2022-01-31 19:04:51 windows python-3.x unicode file-io decode 其他开发

我有一个 ActiveRecord 模型，Foo，它有一个 name 字段.我希望用户能够按名称搜索，但我希望搜索忽略大小写和任何重音符号.因此，我还存储了一个 canonical_name 字段以供搜索: 类 Foovalidates_presence_of :namebefore_validate :set_canonical_name私人的def set_canonical_namesel ..

发布时间：2022-01-31 14:33:42 ruby-on-rails ruby activerecord unicode utf-8 其他开发

如何从 JSON 中获取字符串对象而不是 Unicode?

我正在使用 Python 2 从 ASCII 编码文本文件中解析 JSON. 使用 json 加载这些文件时或 simplejson，我所有的字符串值都被转换为 Unicode 对象字符串对象.问题是，我必须将数据与一些只接受字符串对象的库一起使用.我无法更改库也无法更新它们. 是否可以获取字符串对象而不是 Unicode 对象? 示例 >>> 导入json>>> origi ..

发布时间：2022-01-31 13:23:42 python json serialization unicode python-2.x Python

将带有 json.dumps 的 utf-8 文本保存为 UTF8，而不是 \u 转义序列

..

发布时间：2022-01-31 13:04:52 python json unicode utf-8 escaping Python

unicode相关内容