python-unicode相关内容

在 Python 2.7.3/Raspberry Pi 中使用特殊字符转义 HTML

我被困在这里试图对 HTML 特殊字符进行转义. 有问题的文字是 基本的&埃梅利·桑德 应该转换为基本的&埃梅莉·桑德 文本通过WGET下载(python之外) 要对此进行测试,请使用此行保存一个 ANSI 文件并将其导入. 导入 HTMLParsertrackentry = open('import.txt', 'r').readlines()打印(跟踪条目)tr ..

Python,转换4字节字符以避免MySQL错误“字符串值不正确:"

我需要将(在 Python 中)一个 4 字节的字符转换为其他字符.这是将它插入到我的 utf-8 mysql 数据库中而不会出现错误,例如:“不正确的字符串值:'\xF0\x9F\x94\x8E' for column 'line' at row 1" 通过将 4 字节 unicode-to-mysql 插入 mysql 引发警告 显示这样做: >>>进口重新>>>高点 = re.com ..
发布时间:2021-12-28 16:57:23 数据库

UnicodeDecodeError: ('utf-8' codec) 读取 csv 文件时

我正在尝试读取 csv 以创建数据帧---在列中进行更改---再次将更改的值更新/反映到相同的 csv(to_csv) 中-再次尝试读取该 csv 以创建另一个数据帧...我收到一个错误 UnicodeDecodeError: 'utf-8' 编解码器无法解码位置 7 的字节 0xe7:无效的继续字节 我的代码是 将熊猫导入为 pddf = pd.read_csv("D:\ss.csv") ..
发布时间:2021-12-28 16:43:06 Python

语法错误:当函数返回“£"时,文件中的非 ASCII 字符“\xa3"

说我有一个函数: def NewFunction():返回“£" 我想打印一些前面有井号的东西,当我尝试运行这个程序时它打印了一个错误,显示了这个错误信息: SyntaxError: 文件 'blah' 中的非 ASCII 字符 '\xa3' 但未声明编码;详见 http://www.python.org/peps/pep-0263.html 谁能告诉我如何在返回函数中包含井号?我基本上是 ..
发布时间:2021-12-26 13:24:38 Python

从 Lambda 中的 S3 通知事件获取非 ASCII 文件名

AWS S3 通知事件中的 key 字段(表示文件名)是 URL 转义的. 当文件名包含空格或非 ASCII 字符时,这很明显. 例如,我已将以下文件名上传到 S3: 我的文件 řěąλλυ.txt 收到通知为: {“记录": [“s3":{“目的": {"key": u"我的+文件+%C5%99%C4%9B%C4%85%CE%BB%CE%BB%CF%85.txt"}}]} 我 ..
发布时间:2021-12-08 13:06:07 其他开发

在python2.7中删除字符串中的unicode \u2026之类的字符

我在python2.7中有一个这样的字符串, 这是一些\u03c0 必须清理的文本\u2026!真烦人! 我如何将其转换为这个, 这是一些必须清理的文本!这很烦人! 解决方案 Python 2.x >>>秒'这是一些必须清理的 \\u03c0 文本\\u2026!它很烦人!>>>打印(s.decode('unicode_escape').encode('ascii','ignore' ..

UnicodeDecodeError: 'utf8' 编解码器无法解码字节 0x9c

我有一个套接字服务器,它应该从客户端接收 UTF-8 有效字符. 问题是一些客户端(主要是黑客)通过它发送了所有错误类型的数据. 我可以轻松区分真正的客户端,但我将所有发送的数据记录到文件中,以便稍后进行分析. 有时我会收到这样的 œ 字符,导致 UnicodeDecodeError 错误. 我需要能够制作带有或不带有这些字符的字符串 UTF-8. 更新: 对于 ..
发布时间:2021-12-03 12:51:38 服务器开发

UnicodeEncodeError: 'ascii' 编解码器无法对位置 20 中的字符 u'\xa0' 进行编码:序号不在范围内 (128)

我在处理从不同网页(在不同网站上)获取的文本中的 unicode 字符时遇到问题.我正在使用 BeautifulSoup. 问题在于错误并不总是可重现;它有时适用于某些页面,有时,它会抛出 UnicodeEncodeError.我已经尝试了几乎所有我能想到的方法,但我还没有找到任何可以在不抛出某种 Unicode 相关错误的情况下始终如一地工作的东西. 导致问题的代码部分如下所示: ..
发布时间:2021-11-30 23:19:10 Python

API 调用上的 UnicodeEncodeError (json)

我正在尝试打印此 API 调用的结果,但出现 UnicodeEncodeError.可能是超级菜鸟的问题,但真的很感激这方面的任何帮助:) 导入http.client导入jsonapi_key = '隐藏'connection = http.client.HTTPConnection('api.football-data.org')headers = { 'X-Auth-Token': api_ ..
发布时间:2021-11-15 03:50:43 Python

API 调用上的 UnicodeEncodeError (json)

我正在尝试打印此 API 调用的结果,但出现 UnicodeEncodeError.可能是超级菜鸟的问题,但真的很感激这方面的任何帮助:) 导入http.client导入jsonapi_key = '隐藏'connection = http.client.HTTPConnection('api.football-data.org')headers = { 'X-Auth-Token': api_ ..
发布时间:2021-11-15 03:43:45 Python

Ansible:将带有 unicode 的列表转换为字符串列表(并比较它们)

我创建了一个包含所有 ansible 组主机的列表.但是当我打印列表时,它包含 unicode 字符.u'text' 而不是 "text"有什么有效的方法可以删除/转换它.我在网上查看了其他示例,但没有成功. 带有 unicode 字符的当前(错误)输出: ok: [server.name] =>{"msg": " [u'all', u'coaster', u'aes', u'curo, ..
发布时间:2021-11-11 01:30:20 其他开发

Ansible:将带有 unicode 的列表转换为字符串列表(并比较它们)

我创建了一个包含所有 ansible 组主机的列表.但是当我打印列表时,它包含 unicode 字符.u'text' 而不是 "text"有什么有效的方法可以删除/转换它.我在网上查看了其他示例,但没有成功. 带有 unicode 字符的当前(错误)输出: ok: [server.name] =>{"msg": " [u'all', u'coaster', u'aes', u'curo, ..
发布时间:2021-11-11 00:24:57 其他开发

使用带有字节数的 textwrap.wrap

如何使用 textwrap 模块在一行达到一定字节数之前进行拆分(不拆分多字节字符)? 我想要这样的东西: >>>textwrap.wrap('☺ ☺☺ ☺☺ ☺ ☺ ☺☺ ☺☺', bytewidth=10)☺ ☺☺☺☺ ☺☺ ☺☺☺☺ 解决方案 我最终重写了 textwrap 的一部分,以便在拆分字符串后对单词进行编码. 与 Tom 的解决方案不同,Python 代码不需 ..
发布时间:2021-09-28 19:58:24 Python

从文件中读取 utf-8 转义序列

我有一个 utf-8 编码的文件,其中包含多行 \x02我不喜欢\x0307bananas\x03.\x02嗨,你好吗?你打过电话了? 如何将该文件的行读入列表,解码所有转义序列?我试过下面的代码: with codecs.open(file, 'r', encoding='utf-8') as q:引号 = q.readlines()打印(str(random.choice(quot ..
发布时间:2021-09-15 19:43:59 Python

如何“规范化"python 3 Unicode字符串

我需要比较两个字符串.aa 是从 PDF 文件中提取的(使用 pdfminer/chardet),bb 是键盘输入.如何标准化第一个字符串以进行比较? >>>aa = "ā";>>>bb = “ā">>>aa == bb错误的>>>>>>aa.encode('utf-8')b'\xc4\x81'>>>bb.encode('utf-8')b'a\xcc\x84' 解决方案 您使用 unic ..
发布时间:2021-09-15 19:40:44 其他开发