Python-读取Emoji Unicode字符 [英] Python - Reading Emoji Unicode Characters
本文介绍了Python-读取Emoji Unicode字符的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个从SQLite数据库读取iOS文本消息的Python2.7程序。文本消息是Unicode字符串。在以下文本消息中:
u'thatu2019s U0001f63b'
撇号由u2019
表示,但表情符号由U0001f63b
表示。我查了有问题的表情符号的代码点,它是uf63b
。我不确定0001
来自哪里。可笑的是,我对字符编码知之甚少。
当我使用:
逐个字符打印文本时s = u'thatu2019s U0001f63b'
for c in s:
print c.encode('unicode_escape')
该程序产生以下输出:
t
h
a
t
u2019
s
ud83d
ude3b
我如何才能正确阅读Python中的最后这些字符?我在这里正确地使用了编码吗?我是不是应该在阅读前试着扔掉这些0001
,或者有没有更简单、不那么愚蠢的方法?
推荐答案
我认为您没有正确使用Encode,也不需要这样做。您得到的是一个包含一个4位数字和一个8位数字转义序列的有效Unicode字符串。在REPL中试用一下,比如在OS X上
>>> s = u'thatu2019s U0001f63b'
>>> print s
that’s 😻
在蟒蛇3中,尽管-
Python 3.4.3 (default, Jul 7 2015, 15:40:07)
>>> s = u'thatu2019s U0001f63b'
>>> s[-1]
'😻'
这篇关于Python-读取Emoji Unicode字符的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文