unicode相关内容

JavaScript alt/花哨文本生成

我正在尝试了解Alt Text/花哨文本生成的工作原理。 当我说Alt Text/Fight Text时,我的意思是:Text Like:𝕖𝕩𝕒𝕞𝕡𝕝𝕖 𝕥𝕖𝕩𝕥(Source) 我已经找了40分钟了,但我什么也找不到。我正在尝试用JavaScript制作一些东西,但我甚至不知道如何开始,因为我不了解它是如何生成的。 我想做一个允许您将普通ASCII字符转换 ..
发布时间:2022-03-09 21:04:38 前端开发

将美观/艺术化的Unicode文本转换为ASCII

我有一个类似于&𝖙𝖍𝖚𝖌𝖑𝖎𝖋𝖊;的UNICODE字符串,并希望将其转换为ASCII码格式。 TUG LIFE&QOT;。 我知道我可以通过 在Python中实现这一点 import unidecode print(unidecode.unidecode('𝖙𝖍𝖚𝖌 𝖑𝖎𝖋𝖊')) // thug life 但是,这还会归类我要保留的其他Unicod ..
发布时间:2022-03-09 20:50:31 其他开发

如何去除红宝石中的非ASCII字符

我有一个Ruby CGI(不是Rails),可以从Web表单中挑选照片和标题。我的用户非常热衷于使用智能引号和连字,他们是从其他来源粘贴的。我的Web应用程序不能很好地处理这些非ASCII字符,是否有快速的Ruby字符串操作例程可以清除非ASCII字符? 推荐答案 使用字符串#encode 从Ruby 1.9开始,在字符串编码之间进行转换的官方方式是使用String#encode ..
发布时间:2022-03-09 20:47:09 其他开发

ISO-8859-1与UTF-8?

应该使用什么以及何时使用?或者使用UTF-8总是更好?或ISO-8859-1在特定条件下是否仍然重要? 字符集是否与地理区域相关? 使用代码@charset "utf-8";是否有好处? 或类似 在CSS文件的顶部? 我为此找到的 ..
发布时间:2022-03-09 09:40:31 前端开发

UTF-8:语言使用多少字节来表示可见字符?

是否有表格或类似的表格来显示当编码为UTF8时,不同语言平均需要多少字节来表示可见字符(字形)? 推荐答案 如果您想要一般的东西,我认为您应该坚持这样做: 英语占用略多于每个字符1个字节(偶尔有非ASCII字符,通常是标点符号或符号嵌入文本)。 大多数其他使用拉丁字母的语言使用的数字略高于1,但如果您期望的数字超过1.5,我会感到惊讶。 使用一些其他脚本(希腊语等)的语言每个 ..
发布时间:2022-03-01 23:19:06 其他开发

未知字符的字符代码-字符,例如方形或问号ROB

表示未知字符的符号的字符代码是什么? 如果某个字符未包含在字体中,则它通常显示为正方形,表示该字体中不存在该符号。 那个正方形符号的字符代码是什么?不是不存在的符号代码,而是实际的正方形符号? 我想要UTF-8格式的字符代码。 推荐答案 U+FFFD替换字符=0xEF 0xBF 0xBD ..
发布时间:2022-03-01 23:16:35 其他开发

确定Unicode代码点是否表示来自特定脚本(如拉丁脚本)的字符?

Unicode将字符归类为属于script,例如Latin script。 如何测试特定字符(code point)是否在特定脚本中? 推荐答案 表示枚举中的各种unicode脚本,例如包括Character.UnicodeScript.LATIN。这些与Unicode Script Properties匹配。 您可以通过将字符的code point整数提交给该枚举上的of方法 ..
发布时间:2022-03-01 22:47:10 Java开发

给定Unicode代码点的编号,如何获取该字符的字符串或CharSequence对象

我看过有关在Java中获取Unicode字符的代码点编号的问题和答案。例如,问题How can I get a Unicode character's code?。 但我想要的正好相反:给定一个整数,如何获取分配给该code point数字的该字符的文本? char原始数据类型没有任何用处,仅限于Unicode字符集的Basic Multilingual Plane。该平面表示以Unico ..
发布时间:2022-03-01 22:36:30 Java开发

如何在Tkinter中打印非BMP Unicode字符(例如𝄫;)

注意:从Python 3.8开始,非BMP字符可以在空闲状态下显示(因此,Tkinter现在可能也会显示它们,因为它们都使用Tcl),它是在我发布此问题一段时间后发布的。我计划在试用Python3.9之后(在安装更新版本的xubuntu之后)对此进行编辑。我还读到在IDLE中编辑这些字符可能不像其他字符那样简单;see the last comment here。 所以,今天我创建了输入某些 ..
发布时间:2022-03-01 21:58:03 其他开发

为什么Unicode被限制为0x10FFFF?

为什么最大Unicode码位限制为0x10FFFF?是否可以通过任何编码方案(如UTF-16、UTF-8)表示此代码点以上的Unicode(例如0x10FFFF+0x000001=0x110000)? 推荐答案 是因为utf-16。基础多语种平面之外的字符在utf-16中用surrogate pair表示,第一个编码单元(CU)位于0xD800-0xDBFF之间,第二个编码单元位于0x ..
发布时间:2022-02-21 22:21:43 其他开发

什么是Unicode、UTF-8和UTF-16?

Unicode的基础是什么?为什么需要UTF-8或UTF-16? 我在谷歌上研究过这一点,也在这里搜索过,但我不清楚。 在VSS中,进行文件比较时,有时会出现两个文件的UTF不同的消息,为什么会这样? 请简单解释。 unicode 为什么需要推荐答案? 在早期(不是太早),所有存在的都是ASCII。这很好,因为所需要的只是几个控制字符、标点符号、数字和字母,就像这句话 ..
发布时间:2022-02-21 22:20:03 其他开发

UnicodeDecodeError:“charmap"编解码器无法解码位置 Y 的字节 X:字符映射到 <undefined>

我正在尝试让 Python 3 程序对一个包含信息的文本文件进行一些操作.但是,当尝试读取文件时,出现以下错误: Traceback(最近一次调用最后一次):文件“SCRIPT LOCATION",第 NUMBER 行,在 `text = file.read()`解码中的文件“C:\Python31\lib\encodings\cp1252.py",第 23 行`return ..
发布时间:2022-01-31 19:04:51 其他开发

如何从 JSON 中获取字符串对象而不是 Unicode?

我正在使用 Python 2 从 ASCII 编码 文本文件中解析 JSON. 使用 json 加载这些文件时或 simplejson,我所有的字符串值都被转换为 Unicode 对象字符串对象.问题是,我必须将数据与一些只接受字符串对象的库一起使用.我无法更改库也无法更新它们. 是否可以获取字符串对象而不是 Unicode 对象? 示例 >>> 导入json>>> origi ..
发布时间:2022-01-31 13:23:42 Python