python-unicode - IT屋-程序员软件开发技术分享社区

对于单个Unicode字符串，Python返回的长度为2

在Python2.7中： In [2]: utf8_str = 'xf0x9fx91x8d' In [3]: print(utf8_str) 👍 In [4]: unicode_str = utf8_str.decode('utf-8') In [5]: print(unicode_str) 👍 In [6]: unicode_str Out[6]: u'U0001f44d' In [ ..

在 Python 2.7.3/Raspberry Pi 中使用特殊字符转义 HTML

我被困在这里试图对 HTML 特殊字符进行转义. 有问题的文字是基本的&埃梅利·桑德应该转换为基本的&埃梅莉·桑德文本通过WGET下载(python之外) 要对此进行测试，请使用此行保存一个 ANSI 文件并将其导入. 导入 HTMLParsertrackentry = open('import.txt', 'r').readlines()打印(跟踪条目)tr ..

发布时间：2022-01-05 11:00:12 python-2.7 character-encoding html-parsing raspberry-pi python-unicode 其他开发

Python，转换4字节字符以避免MySQL错误“字符串值不正确:"

我需要将(在 Python 中)一个 4 字节的字符转换为其他字符.这是将它插入到我的 utf-8 mysql 数据库中而不会出现错误，例如:“不正确的字符串值:'\xF0\x9F\x94\x8E' for column 'line' at row 1" 通过将 4 字节 unicode-to-mysql 插入 mysql 引发警告显示这样做: >>>进口重新>>>高点 = re.com ..

发布时间：2021-12-28 16:57:23 python mysql utf-8 character-encoding python-unicode 数据库

UnicodeDecodeError: ('utf-8' codec) 读取 csv 文件时

我正在尝试读取 csv 以创建数据帧---在列中进行更改---再次将更改的值更新/反映到相同的 csv(to_csv) 中-再次尝试读取该 csv 以创建另一个数据帧...我收到一个错误 UnicodeDecodeError: 'utf-8' 编解码器无法解码位置 7 的字节 0xe7:无效的继续字节我的代码是将熊猫导入为 pddf = pd.read_csv("D:\ss.csv") ..

发布时间：2021-12-28 16:43:06 python pandas utf-8 python-unicode Python

UnicodeEncodeError: 'ascii' 编解码器无法对位置 7 的字符 u'\xe9' 进行编码:序号不在范围内 (128)

我有这个代码: printinfo = title + "\t" + old_vendor_id + "\t" + apple_id + '\n'# 写入文件f.write (printinfo + '\n') 但是我在运行时遇到这个错误: f.write(printinfo + '\n')UnicodeEncodeError: 'ascii' 编解码器无法对位置 7 的字符 u'\xe ..

发布时间：2021-12-27 15:49:40 python xml unicode encoding python-unicode Python

语法错误:当函数返回“£"时，文件中的非 ASCII 字符“\xa3"

说我有一个函数: def NewFunction():返回“£" 我想打印一些前面有井号的东西，当我尝试运行这个程序时它打印了一个错误，显示了这个错误信息: SyntaxError: 文件 'blah' 中的非 ASCII 字符 '\xa3' 但未声明编码；详见 http://www.python.org/peps/pep-0263.html 谁能告诉我如何在返回函数中包含井号?我基本上是 ..

发布时间：2021-12-26 13:24:38 python unicode python-unicode Python

从 Lambda 中的 S3 通知事件获取非 ASCII 文件名

AWS S3 通知事件中的 key 字段(表示文件名)是 URL 转义的. 当文件名包含空格或非 ASCII 字符时，这很明显. 例如，我已将以下文件名上传到 S3: 我的文件 řěąλλυ.txt 收到通知为: {“记录": [“s3":{“目的": {"key": u"我的+文件+%C5%99%C4%9B%C4%85%CE%BB%CE%BB%CF%85.txt"}}]} 我 ..

发布时间：2021-12-08 13:06:07 python-2.7 amazon-s3 utf-8 aws-lambda python-unicode 其他开发

UnicodeDecodeError: 'utf8' 编解码器无法解码位置 3131 中的字节 0x80:起始字节无效

我正在尝试使用 python 2.7.12 从 json 文件中读取 twitter 数据. 我使用的代码是这样的: 导入 json导入系统重新加载(系统)sys.setdefaultencoding('utf-8')def get_tweets_from_file(file_name):推文 = []使用 open(file_name, 'rw') 作为 twitter_file:对于 ..

发布时间：2021-12-08 12:44:43 json python-2.7 utf-8 ascii python-unicode 其他开发

在python2.7中删除字符串中的unicode \u2026之类的字符

我在python2.7中有一个这样的字符串，这是一些\u03c0 必须清理的文本\u2026！真烦人！我如何将其转换为这个，这是一些必须清理的文本！这很烦人！解决方案 Python 2.x >>>秒'这是一些必须清理的 \\u03c0 文本\\u2026！它很烦人！>>>打印(s.decode('unicode_escape').encode('ascii','ignore' ..

发布时间：2021-12-08 12:13:32 python python-2.7 non-ascii-characters python-unicode unicode-escapes Python

Python - “ascii"编解码器无法解码字节

我真的很困惑.我试图编码，但错误说 can't decode.... >>>"你好".encode("utf8")回溯(最近一次调用最后一次):文件“"，第 1 行，在中UnicodeDecodeError: 'ascii' 编解码器无法解码位置 0 中的字节 0xe4:序号不在范围内 (128) 我知道如何避免字符串上带有“u"前缀的错误.我只是想知道为 ..

发布时间：2021-12-08 12:12:21 python python-2.7 unicode python-2.x python-unicode Python

UnicodeDecodeError: 'utf8' 编解码器无法解码字节 0x9c

我有一个套接字服务器，它应该从客户端接收 UTF-8 有效字符. 问题是一些客户端(主要是黑客)通过它发送了所有错误类型的数据. 我可以轻松区分真正的客户端，但我将所有发送的数据记录到文件中，以便稍后进行分析. 有时我会收到这样的 œ 字符，导致 UnicodeDecodeError 错误. 我需要能够制作带有或不带有这些字符的字符串 UTF-8. 更新: 对于 ..

发布时间：2021-12-03 12:51:38 python linux python-unicode 服务器开发

UnicodeEncodeError: 'ascii' 编解码器无法对位置 20 中的字符 u'\xa0' 进行编码:序号不在范围内 (128)

我在处理从不同网页(在不同网站上)获取的文本中的 unicode 字符时遇到问题.我正在使用 BeautifulSoup. 问题在于错误并不总是可重现；它有时适用于某些页面，有时，它会抛出 UnicodeEncodeError.我已经尝试了几乎所有我能想到的方法，但我还没有找到任何可以在不抛出某种 Unicode 相关错误的情况下始终如一地工作的东西. 导致问题的代码部分如下所示: ..

发布时间：2021-11-30 23:19:10 python unicode beautifulsoup python-2.x python-unicode Python

API 调用上的 UnicodeEncodeError (json)

我正在尝试打印此 API 调用的结果，但出现 UnicodeEncodeError.可能是超级菜鸟的问题，但真的很感激这方面的任何帮助:) 导入http.client导入jsonapi_key = '隐藏'connection = http.client.HTTPConnection('api.football-data.org')headers = { 'X-Auth-Token': api_ ..

发布时间：2021-11-15 03:50:43 python json api unicode python-unicode Python

API 调用上的 UnicodeEncodeError (json)

我正在尝试打印此 API 调用的结果，但出现 UnicodeEncodeError.可能是超级菜鸟的问题，但真的很感激这方面的任何帮助:) 导入http.client导入jsonapi_key = '隐藏'connection = http.client.HTTPConnection('api.football-data.org')headers = { 'X-Auth-Token': api_ ..

发布时间：2021-11-15 03:43:45 python json api unicode python-unicode Python

Ansible:将带有 unicode 的列表转换为字符串列表(并比较它们)

我创建了一个包含所有 ansible 组主机的列表.但是当我打印列表时，它包含 unicode 字符.u'text' 而不是 "text"有什么有效的方法可以删除/转换它.我在网上查看了其他示例，但没有成功. 带有 unicode 字符的当前(错误)输出: ok: [server.name] =>{"msg": " [u'all', u'coaster', u'aes', u'curo, ..

发布时间：2021-11-11 01:30:20 list ansible diff python-unicode ansible-awx 其他开发

Ansible:将带有 unicode 的列表转换为字符串列表(并比较它们)

我创建了一个包含所有 ansible 组主机的列表.但是当我打印列表时，它包含 unicode 字符.u'text' 而不是 "text"有什么有效的方法可以删除/转换它.我在网上查看了其他示例，但没有成功. 带有 unicode 字符的当前(错误)输出: ok: [server.name] =>{"msg": " [u'all', u'coaster', u'aes', u'curo, ..

发布时间：2021-11-11 00:24:57 list ansible diff python-unicode ansible-awx 其他开发

使用带有字节数的 textwrap.wrap

如何使用 textwrap 模块在一行达到一定字节数之前进行拆分(不拆分多字节字符)? 我想要这样的东西: >>>textwrap.wrap('☺ ☺☺ ☺☺ ☺ ☺ ☺☺ ☺☺', bytewidth=10)☺ ☺☺☺☺ ☺☺ ☺☺☺☺ 解决方案我最终重写了 textwrap 的一部分，以便在拆分字符串后对单词进行编码. 与 Tom 的解决方案不同，Python 代码不需 ..

发布时间：2021-09-28 19:58:24 python python-3.x split word-wrap python-unicode Python

从文件中读取 utf-8 转义序列

我有一个 utf-8 编码的文件，其中包含多行 \x02我不喜欢\x0307bananas\x03.\x02嗨，你好吗?你打过电话了? 如何将该文件的行读入列表，解码所有转义序列?我试过下面的代码: with codecs.open(file, 'r', encoding='utf-8') as q:引号 = q.readlines()打印(str(random.choice(quot ..

发布时间：2021-09-15 19:43:59 python python-unicode utf8-decode Python

Python 3.6，utf-8 到 unicode 的转换，带双反斜杠的字符串

有很多关于 utf-8 > unicode 转换的问题，但我仍然没有找到我的问题的答案. 让我们有这样的字符串: a = "Je-li pro za\\xc5\\x99azov\\xc3\\xa1n\\xc3\\xad" Python 3.6 理解这个字符串就像 Je-li pro za\xc5\x99azov\xc3\xa1n\xc3\xad.我需要将此类似 utf-8 的字符串转换为 ..

发布时间：2021-09-15 19:42:34 python-3.x unicode utf-8 python-unicode 其他开发

如何“规范化"python 3 Unicode字符串

我需要比较两个字符串.aa 是从 PDF 文件中提取的(使用 pdfminer/chardet)，bb 是键盘输入.如何标准化第一个字符串以进行比较? >>>aa = "ā";>>>bb = “ā">>>aa == bb错误的>>>>>>aa.encode('utf-8')b'\xc4\x81'>>>bb.encode('utf-8')b'a\xcc\x84' 解决方案您使用 unic ..

发布时间：2021-09-15 19:40:44 python-3.x utf-8 python-unicode 其他开发

python-unicode相关内容