将美观/艺术化的Unicode文本转换为ASCII [英] Convert fancy/artistic unicode text to ASCII

查看:28
本文介绍了将美观/艺术化的Unicode文本转换为ASCII的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个类似于&𝖙𝖍𝖚𝖌𝖑𝖎𝖋𝖊;的UNICODE字符串,并希望将其转换为ASCII码格式。

TUG LIFE&QOT;。

我知道我可以通过

在Python中实现这一点
import unidecode
print(unidecode.unidecode('𝖙𝖍𝖚𝖌 𝖑𝖎𝖋𝖊'))
// thug life

但是,这还会归类我要保留的其他Unicode字符(如中文/日文字符、表情符号、重音字符等)。

是否有方法检测这些类型的艺术Unicode字符?

更多示例:

𝓽𝓱𝓾𝓰𝓵𝓲𝓯𝓮

𝓉𝒽𝓊𝑔𝓁𝒾𝒻𝑒

𝕥𝕙𝕦𝕘𝕝𝕚𝕗𝕖

暴徒生活

谢谢您的帮助!

推荐答案

import unicodedata
strings = [
  '𝖙𝖍𝖚𝖌 𝖑𝖎𝖋𝖊',
  '𝓽𝓱𝓾𝓰 𝓵𝓲𝓯𝓮',
  '𝓉𝒽𝓊𝑔 𝓁𝒾𝒻𝑒',
  '𝕥𝕙𝕦𝕘 𝕝𝕚𝕗𝕖',
  'thug life']
for x in strings:
  print(unicodedata.normalize( 'NFKC', x), x)

输出.62803325.py

thug life 𝖙𝖍𝖚𝖌 𝖑𝖎𝖋𝖊
thug life 𝓽𝓱𝓾𝓰 𝓵𝓲𝓯𝓮
thug life 𝓉𝒽𝓊𝑔 𝓁𝒾𝒻𝑒
thug life 𝕥𝕙𝕦𝕘 𝕝𝕚𝕗𝕖
thug life thug life

资源

这篇关于将美观/艺术化的Unicode文本转换为ASCII的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆