encoding相关内容

Encoding.Default 在 .NET 中如何工作?

我正在使用以下方法读取文件: var source = File.ReadAllText(path); 并且字符 © 没有被正确加载. 然后,我将其更改为: var source = File.ReadAllText(path, Encoding.UTF8); 什么都没有. 我决定尝试使用 var source = File.ReadAllText(path, Encodin ..
发布时间:2022-01-04 08:40:00 C#/.NET

Java 中的自动检测字符编码

似乎是一个相当热门的问题,但我还没有找到解决方案;也许是因为它有很多 种口味.虽然在这里.我正在尝试读取一些逗号分隔的文件(有时分隔符可能比逗号更独特一点,但现在逗号就足够了). 这些文件应该在整个行业进行标准化,但最近我们看到了许多不同类型的字符集文件.我希望能够设置一个 BufferedReader 来弥补这一点. 执行此操作并检测它是否成功的非常标准的方法是什么? 我对这种 ..
发布时间:2022-01-04 08:34:05 Java开发

为 clojure 源文件启用 UTF-8 编码

我正在做一个涉及 maven、java 和 clojure 的项目.我面临的问题是,我的 clojure 源文件中有一些 UTF-8 字符,因为我的源代码没有被 java 编译器正确解释,我有点通过设置让它工作环境变量 JAVA_TOOL_OPTIONS=-Dfile.encoding=UTF8,但我想要的是通过 MAVEN 传递这个属性. 我已经尝试过设置 MAVEN_OPTS=-Dfil ..
发布时间:2022-01-02 22:47:08 Java开发

如何重置 emacs 以 utf-8-unix 字符编码保存文件?

我有问题.我发现 emacs 最近停止使用默认字符集“utf-8-unix"保存我所有的新文件.我不明白我做了什么,但是当我打开一个文件时,在迷你缓冲区上方我看到“--:---"而不是“-U:---",其中“U"表示文件以 utf-8-unix 字符集保存.如何重置 emacs 以将文件保存在正确的编码系统中??? 解决方案 这是我的设置: ;;;;;;;;;;;;;;;;;;;;;;; ..
发布时间:2022-01-02 20:07:08 服务器开发

在 Python 中将分类数据转换为数值数据

我有一个数据集.它的一列 - “关键字" - 包含分类数据.我尝试使用的机器学习算法仅采用数字数据.我想将“关键字"列转换为数值 - 我该怎么做?使用自然语言处理?一袋话? 我尝试了以下方法,但我得到了 ValueError: Expected 2D array, got 1D array instead. from sklearn.feature_extraction.text impo ..
发布时间:2022-01-02 18:01:41 AI人工智能

在 Windows Phone 8 中读取 Windows-1252 编码

在 Windows 中,我可以通过 .NET 使用 Encoding.GetEncoding(“Windows-1252")来检索“Windows-1252"代码页编码.不幸的是,此调用在 Windows Phone 8 模拟器中引发 ArgumentExtception,指定编码名称无效.我环顾了 MSDN,但没有找到任何有用的东西.有谁知道 Windows Phone 8 中可用的编码以及“W ..
发布时间:2022-01-01 12:25:37 C#/.NET

在 Python 中将多字节字符转换为 7 位 ASCII

我正在通过 Python 脚本下载和解析网页.我需要它编码为 7 位 ASCII 以供进一步处理.我正在使用请求库 (http://docs.python-requests.org/en/master/) 在一个virtualenv 基于 Ubuntu 16.04 LTS 的任何内容. 我想要请求包或某个包来处理翻译成 ASCII,不需要我做进一步的翻译编码字符,因为我知道我会错过一些人物. ..
发布时间:2021-12-31 20:30:01 Python

Python 库将多字节字符转换为 Python 中的 7 位 ASCII

是否有提供将多字节非 ASCII 字符转换为某种合理形式的 7 位可显示 ASCII 的 Python 库.这是为了避免对 answer 中给出的 charmap 进行硬编码到 在 Python 中将多字节字符转换为 7 位 ASCII 编辑:我目前使用的是 Python 2.7.11 或更高版本,但尚未使用 Python 3,但将考虑提供 Python 3 解决方案的答案并发现其有帮助. ..
发布时间:2021-12-31 20:25:03 Python

节点:将 utf8 字符串转换为 base64 以作为 Parse.com 文件上传

我不确定这个问题是特定于 Parse.com 还是我对 NodeJS 编码的(基本)理解有问题. 我一直在使用 Parse 上传文本文件 - 这很好用,但看起来文件内容不是 UTF8 编码的(基于我从浏览器中的数据浏览器看到的内容). 在保存文件之前我应该​​做些什么以确保文本存储为 unicode? 我用来上传的代码是: //测试字符串var a = '検索 • Busca • ..
发布时间:2021-12-30 17:11:22 其他开发

使用 sqlalchemy 和 postgresql 编码错误

我将金字塔用于带有 postgres 数据库、wtforms、sqlalchemy 和 jinja2 的 Web 应用程序,当应用程序尝试从数据库中获取问题类型以使用 wtforms 填充选择字段时出现此错误: 错误:“ascii"编解码器无法解码位置 5 中的字节 0xc3:序号不在范围内(128) 这是model.py中的问题类型表: class Mixin(object):id = C ..
发布时间:2021-12-30 14:51:41 Python

SQLAlchemy 和 UnicodeDecodeError

我要了 UnicodeDecodeError: 'ascii' 编解码器无法解码位置 0 中的字节 0xc2:序号不在范围内 (128) 当我将来自我使用 SQLAlchemy 访问的 MySQL 数据库的文本传递给这个函数时: re.compile(ur"]+)>", flags=re.UNICODE).sub(u" ", s) 数据库编码为 utf-8,我什至将编码传递给 SQLAlc ..
发布时间:2021-12-30 14:51:08 数据库

PHP 发送的邮件有 =0A=0A 而不是换行

一段时间以来,我遇到了一些用户收到 =0A=0A 而不是我通过 PHP 发送给他们的电子邮件中的新行的问题.通过电子邮件客户端的通信效果很好,但 PHP 生成的电子邮件对于某些用户(少数)来说总是这样.谷歌搜索没有发现像样的结果,所有搜索结果似乎都以某种方式与 Outlook 相关 - 认为所有 Outlook 用户都会遇到这个问题是不可接受的.有谁知道处理这个问题和避免这些新行编码问题的正确方法 ..
发布时间:2021-12-29 15:48:06 PHP

使用批处理打开包含元音变音的 URL

我想用批处理文件在 chrome 中打开一个 URL.这适用于普通网址,但不适用于带有变音符号的网址. 启动 chrome.exe https://trends.google.de/trends/explore?q=mähroboter 我不能使用“ae"代替“ä",因为它会在 Google 趋势上给我不同的结果. 当我保持这样时,浏览器中的 URL 变为 https://trends ..
发布时间:2021-12-29 13:08:31 其他开发

GWT:字符编码变音

我想在标签中设置文本: labelDemnaechst.setText(" Demnächst fällig:"); 在应用程序的输出中,字符“ä"显示错误. 我怎样才能很好地展示它们? 解决方案 好吧,您必须将特殊字符编码为 Unicode.您可以在此处找到代表性的 Unicode 字符列表. 您的示例如下所示: labelDemnaechst.setText("De ..
发布时间:2021-12-28 22:16:00 其他开发

通过 TcpClient (byte[]) 发送包含特殊字符的字符串

我正在尝试通过 TcpClient (byte[]) 发送包含特殊字符的字符串.举个例子: 客户在文本框中输入“amé" 客户端使用某种编码将字符串转换为字节[](我已经尝试了所有预定义的编码以及诸如“iso-8859-1"之类的) 客户端通过 TCP 发送 byte[] 服务器接收并输出使用相同编码重新转换的字符串(到列表框) 编辑: 我忘了提到结果字符串是“am?". ..
发布时间:2021-12-28 13:10:09 C#/.NET

.NET 中的分块编码实现(或至少是伪代码)

我为 HTTP/HTTPS 请求编写了一个原始 TCP 客户端,但是我遇到了分块编码响应的问题.HTTP/1.1 是必需的,所以我应该支持它. Raw TCP 是我需要保留的业务需求,因此我无法切换到 .NET HTTPWebRequest/HTTPWebResponse 但是,如果有办法将 RAW HTTP 请求/响应转换为 HTTPWebRequest/有效的 HTTPWebRespon ..
发布时间:2021-12-28 12:47:06 C#/.NET

使 Emacs 在 Python 交互模式下使用 UTF-8

当我从 Mac OS 的 Terminal.app 启动 Python 时,python 将编码识别为 UTF-8: $ python3.0Python 3.0.1(r301:69556,2009 年 5 月 18 日,16:44:01)[GCC 4.0.1 (Apple Inc. build 5465)] 在达尔文上输入“帮助"、“版权"、“信用"或“许可证"以获取更多信息.>>>导入系统>> ..
发布时间:2021-12-28 10:47:37 Python

如何检测 Go 中何时无法将字节转换为字符串?

存在无法转换为 Unicode 字符串的无效字节序列.在 Go 中将 []byte 转换为 string 时如何检测? 解决方案 正如 Tim Cooper 所说,您可以使用 utf8.Valid. 但是!您可能认为将非 UTF-8 字节转换为 Go string 是不可能的.事实上,“在 Go 中,字符串实际上是一个只读的字节片";它可以包含不是有效 UTF-8 的字节,您可以打印 ..
发布时间:2021-12-27 16:01:12 其他开发