将美观/艺术化的Unicode文本转换为ASCII [英] Convert fancy/artistic unicode text to ASCII
本文介绍了将美观/艺术化的Unicode文本转换为ASCII的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个类似于&𝖙𝖍𝖚𝖌𝖑𝖎𝖋𝖊;的UNICODE字符串,并希望将其转换为ASCII码格式。
TUG LIFE&QOT;。
我知道我可以通过
在Python中实现这一点import unidecode
print(unidecode.unidecode('𝖙𝖍𝖚𝖌 𝖑𝖎𝖋𝖊'))
// thug life
但是,这还会归类我要保留的其他Unicode字符(如中文/日文字符、表情符号、重音字符等)。
是否有方法检测这些类型的艺术Unicode字符?
更多示例:
𝓽𝓱𝓾𝓰𝓵𝓲𝓯𝓮
𝓉𝒽𝓊𝑔𝓁𝒾𝒻𝑒
𝕥𝕙𝕦𝕘𝕝𝕚𝕗𝕖
暴徒生活
谢谢您的帮助!
推荐答案
import unicodedata
strings = [
'𝖙𝖍𝖚𝖌 𝖑𝖎𝖋𝖊',
'𝓽𝓱𝓾𝓰 𝓵𝓲𝓯𝓮',
'𝓉𝒽𝓊𝑔 𝓁𝒾𝒻𝑒',
'𝕥𝕙𝕦𝕘 𝕝𝕚𝕗𝕖',
'thug life']
for x in strings:
print(unicodedata.normalize( 'NFKC', x), x)
输出:.62803325.py
thug life 𝖙𝖍𝖚𝖌 𝖑𝖎𝖋𝖊 thug life 𝓽𝓱𝓾𝓰 𝓵𝓲𝓯𝓮 thug life 𝓉𝒽𝓊𝑔 𝓁𝒾𝒻𝑒 thug life 𝕥𝕙𝕦𝕘 𝕝𝕚𝕗𝕖 thug life thug life
资源:
unicodedata
-Unicode Database- Normalization forms for Unicode text
这篇关于将美观/艺术化的Unicode文本转换为ASCII的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文