如何使用u转义代码对Python3字符串进行编码? [英] How to encode Python 3 string using u escape code?

查看:56
本文介绍了如何使用u转义代码对Python3字符串进行编码?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

在Python 3中,假设我有

>>> thai_string = 'สีเ'

使用encode可提供

>>> thai_string.encode('utf-8')
b'xe0xb8xaaxe0xb8xb5'
我的问题:如何使用u而不是xencode()返回bytes序列?我如何才能将它们decode恢复为Python 3str类型?

我尝试使用ascii内置,它提供

>>> ascii(thai_string)
"'\u0e2a\u0e35'"

但这似乎不太正确,因为我无法将其解码回以获得thai_string

Python documentation告诉我

  • xhh转义祸不单行值为hh的字符,同时
  • uxxxx转义具有16位祸不单行值的字符xxxx

文档说u只在字符串文字中使用,但我不确定这是什么意思。这是否暗示我的问题有缺陷的前提?

推荐答案

可以使用unicode_escape

>>> thai_string.encode('unicode_escape')
b'\u0e2a\u0e35\u0e40'

请注意,encode()将始终返回一个字节字符串(字节)和unicode_escape编码is intended to

在Python源代码中生成适合作为Unicode文本的字符串

这篇关于如何使用u转义代码对Python3字符串进行编码?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆