Python-读取Emoji Unicode字符 [英] Python - Reading Emoji Unicode Characters

查看:0
本文介绍了Python-读取Emoji Unicode字符的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个从SQLite数据库读取iOS文本消息的Python2.7程序。文本消息是Unicode字符串。在以下文本消息中:

u'thatu2019s U0001f63b'

撇号由u2019表示,但表情符号由U0001f63b表示。我查了有问题的表情符号的代码点,它是uf63b。我不确定0001来自哪里。可笑的是,我对字符编码知之甚少。

当我使用:

逐个字符打印文本时
s = u'thatu2019s U0001f63b'

for c in s:
    print c.encode('unicode_escape')

该程序产生以下输出:

t
h
a
t
u2019
s

ud83d
ude3b

我如何才能正确阅读Python中的最后这些字符?我在这里正确地使用了编码吗?我是不是应该在阅读前试着扔掉这些0001,或者有没有更简单、不那么愚蠢的方法?

推荐答案

我认为您没有正确使用Encode,也不需要这样做。您得到的是一个包含一个4位数字和一个8位数字转义序列的有效Unicode字符串。在REPL中试用一下,比如在OS X上

>>> s = u'thatu2019s U0001f63b'
>>> print s
that’s 😻

在蟒蛇3中,尽管-

Python 3.4.3 (default, Jul  7 2015, 15:40:07) 
>>> s  = u'thatu2019s U0001f63b'
>>> s[-1]
'😻'

这篇关于Python-读取Emoji Unicode字符的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆