encoding相关内容

如何将 utf-8 花式引号转换为中性引号

我正在编写一个 Python 小脚本,用于解析 Word 文档并写入 csv 文件.但是,有些文档包含一些 utf-8 字符,我的脚本无法正确处理. 花式引号经常出现(u'\u201c').有没有一种快速、简单(和智能)的方法可以用支持中性 ascii 的引号替换那些引号,所以我可以将 line.encode('ascii') 写入 csv 文件? 我试图找到左引号并替换它: val ..
发布时间:2021-12-27 15:53:52 Python

在 python 中使用 csv 模块读取 .xlsx

我正在尝试使用 csv 模块读取 .xlsx 格式的 excel 文件,但是即使使用我的方言和编码,在使用 excel 文件时也没有任何运气指定的.下面,我用我尝试过的不同编码展示了我的不同尝试和错误结果.如果有人能指出我可以用来在 Python 中读取 .xlsx 文件的正确编码、语法或模块,我将不胜感激. 使用下面的代码,我收到以下错误:_csv.Error: line contains ..
发布时间:2021-12-27 15:53:34 Python

Python UTF-8 小写土耳其语特定字母

使用 python 2.7: >myCity = 'Isparta'>myCity.lower()>'isparta'#-应该->'ısparta' 尝试了一些解码(例如,myCity.decode("utf-8").lower()),但找不到怎么做. 怎么才能降低这种字母?('I' > 'ı', 'İ' > 'i' 等) 编辑:在土耳其语中,“I"的小写是“ı".'i' 的大写是 ..
发布时间:2021-12-27 15:53:16 Python

如何设置 MediaRecorder 以获得最佳的视频质量效果?

谁能告诉我如何在MediaRecorder中设置参数,以便在不考虑手机物理限制的情况下通过编码获得最佳视频录制效果?还是我对MediaRecorder的编码造成的视图小失真有什么影响? 如果你们中的一些人可能会猜测不清楚的参数,我实际上是在使用首选项设置一些参数.我错过了哪些可能有助于改进视频编码过程的参数,例如:帧率 解决方案 根据 API 级别,您可能希望使用或不使用现有配置文件 ..
发布时间:2021-12-27 15:53:08 Java开发

如何使用 Python 3.4 (Windows 8) 将 utf-8 打印到控制台?

我正在尝试将 utf-8 卡片符号(♠、♥、♦︎︎、♣)从 Python 模块打印到 Windows 控制台.我使用的控制台是 git bash,我使用 console2 作为前端.我已经尝试/阅读了以下多种方法,但到目前为止没有任何效果. 确保控制台可以处理 utf-8 字符.这两个测试让我相信控制台不是问题. 尝试从 python 模块做同样的事情. 当我执行 .py 时,这是结 ..
发布时间:2021-12-27 15:52:50 Python

wkhtmltopdf 上的平方字符问题

我已经在 Centos 5.5 上安装了 wkhtmltopdf.(因为有图书馆问题,已经 4 天了).现在部分工作了.我说部分是因为 wkhtmltopdf 创建的所有 pdf 都包含正方形而不是文本? 我能做什么?我用谷歌搜索过,但找不到任何东西. 感谢您的帮助. 解决方案 当我遇到黑色方块问题时,我可以通过安装 urw-fonts 包来解决它,而无需安装 X11. ..
发布时间:2021-12-27 15:52:42 其他开发

更改“引用可打印"编码为“utf-8"

我正在尝试使用 imaplib 阅读电子邮件.我收到了这个邮件正文: =C4=EE=E1=F0=FB=E9 =E4=E5=ED=FC! 那是 Quoted-printable 编码. 我需要从中获取 utf-8 .应该是Добрый день! 我在谷歌上搜索过,但 Python 的版本太混乱了.它在 Python 3 中已经是 unicode,我不能在这里使用 .encode('ut ..
发布时间:2021-12-27 15:52:29 Python

为什么这种转换到 utf8 不起作用?

我有一个子进程命令,它输出一些字符,例如“\xf1".我正在尝试将其解码为 utf8,但出现错误. s = '\xf1's.decode('utf-8') 以上抛出: UnicodeDecodeError: 'utf8' 编解码器无法解码位置 0 中的字节 0xf1:数据意外结束 它在我使用“latin-1"时有效,但 utf8 不应该也有效吗?我的理解是 latin1 是 utf8 的子 ..
发布时间:2021-12-27 15:52:13 Python

ruby 1.9 有没有办法从字符串中删除无效的字节序列?

假设你有一个像 "€foo\xA0" 这样的字符串,编码为 UTF-8,有没有办法从这个字符串中删除无效的字节序列?(所以你得到 "€foo" ) 在 ruby​​-1.8 中,您可以使用 Iconv.iconv('UTF-8//IGNORE', 'UTF-8', "€foo\xA0") 但现在已弃用."€foo\xA0".encode('UTF-8') 什么都不做,因为它已经是 UTF-8 ..
发布时间:2021-12-27 15:52:05 其他开发

sun.jnu.encoding 究竟是什么?

系统属性sun.jnu.encoding 的用途是什么?网络上的各种片段设置或报告,但我找不到定义. 解决方案 参见 http://happygiraffe.net/blog/2009/09/24/java-platform-encoding/ 此链接描述了 sun.jnu.encoding 属性的用法,用于在解析通过命令行传递的值时使用正确的编码,设置 file.encoding属 ..
发布时间:2021-12-27 15:51:28 Java开发

URL 解码:Java 中的 UnsupportedEncodingException

我从文档中了解到 UnsupportedEncodingException 只能在我指定错误的编码作为 URLDecoder.decode(String, String) 方法的第二个参数时抛出.是这样吗?我需要知道可以抛出此异常的情况. 基本上,我的一个函数中有这个代码段: if (keyVal.length == 2) {尝试 {值 = URLDecoder.decode(键值[1], ..
发布时间:2021-12-27 15:51:19 Java开发

编码和整理的区别?

我看到了与 encoding 和 collat​​ion 相关的某些问题和错误.任何访问者都可以解释 MySQL 域的区别吗? 解决方案 编码是指使用的字符集. 排序规则决定了排序顺序. 参见:http://dev.mysql.com/doc/refman/5.5/en/charset-general.html ..
发布时间:2021-12-27 15:51:12 数据库

PowerShell 输出文件:防止编码更改

我目前正在尝试使用 powershell 自动执行一些搜索和替换操作.不幸的是,我昨天意识到我们的代码库中有不同的文件编码(UTF8 和 ASCII).因为我们在不同的分支中进行这些搜索和替换操作,所以在这个阶段我无法更改文件编码. 如果我运行以下行,它会将所有文件更改为 UCS-2 Little Eindian,即使我的默认 powershell 编码设置为 iso-8859-1(西欧 ( ..
发布时间:2021-12-27 15:51:06 其他开发

为什么 '%20' 被用作 URL 中的空格的起源

我很想知道为什么将“%20"用作 URL 中的空格,尤其是为什么要使用 %20 以及为什么我们首先需要它. 解决方案 它被称为百分比编码.某些字符不能在 URI 中(例如 #,因为它表示 URL 片段),因此它们用可以(# 变成 >%23) 这是同一篇文章的摘录: 当保留集中的字符(“保留字符")具有特定上下文中的特殊含义(“保留目的")和 URI方案说有必要将该字符用于其他一 ..
发布时间:2021-12-27 15:50:53 其他开发