encoding相关内容

不同的字符集有什么用?

C++ 标准提到了多种不同的字符集.特别是,它提到了以下字符集: 在 2.2 [lex.phases] bullet 1 物理源文件字符及其到基本源字符集的映射被提及. 在 2.2 [lex.phases] bullet 2 中提到了执行字符集. 在 2.3 [lex.charset] 第 3 段中提到了一个基本执行字符集和一个基本执行宽字符集. 同样的第 2.3 节 [lex.cha ..
发布时间:2021-12-27 15:44:03 C/C++开发

Volley 请求中的 UTF-8 编码

在我的 Android 应用程序中,我正在使用 Volley JsonArrayRequest 加载 json 数据.数据是我自己创建的,我用 UTF-8 编码的 Sublime 保存了它们.当我得到 Response 并填写我的 ListView 时,文本显示不正确(变音).这是我的请求的样子: JsonArrayRequest request = new JsonArrayRequest(t ..
发布时间:2021-12-27 15:43:49 移动开发

如何将编码的标签呈现为正确的 HTML,而不是文本?

我从数据库中获取以下文本:(由客户提供,所以我不能用它做太多事情) 投资专业人士. 等等等等等等 呈现为: 投资专业人士. 等等等等等等 我不想在屏幕上打印 标签.我希望他们表现得像真正的休息时间. 以下 Html Helper 代码构建它所在的跨度,将其添加到 div 并返回 HTML 字符串: StringBuilder sbElements = ..
发布时间:2021-12-27 15:43:40 C#/.NET

在javascript中将对话UTF-8编码为1251

我需要在 JavaScript 中将 UTF-8 中的字符串转换为 1251 代码页中的字节数组.谷歌说没有任何用处.帮助:) 编辑:它是做什么用的. 我们有服务器和客户端.服务器具有使用 SHA512 和 1251 代码页的用户密码.客户端(Web 浏览器)必须使用 SHA512 散列密码(由用户以纯文本形式提供)并将其传输到服务器.问题是:浏览器使用 UTF-8 编码,当然 UFT ..
发布时间:2021-12-27 15:43:21 前端开发

R 中的 Unicode 规范化(形式 C):将所有带有重音符号的字符转换为它们的单一 Unicode 字符形式?

在 Unicode 中,带重音的字母可以用两种方式表示:重音字母本身,以及裸字母加重音的组合.例如,é (+U00E9) 和 e´ (+U0065 +U0301) 通常以相同的方式显示. R 呈现以下内容(版本 3.0.2,Mac OS 10.7.5): >“\u00e9"[1] "é">“\u0065\u0301"[1] "é" 当然: >"\u00e9" == "\u0065\u0 ..
发布时间:2021-12-27 15:43:11 其他开发

Java 字符串编码 (UTF-8)

我遇到了这一行遗留代码,我正在尝试弄清楚: String newString = new String(oldString.getBytes("UTF-8"), "UTF-8")); 据我所知,它是编码&使用相同的字符集解码. 这与以下有何不同? String newString = oldString; 是否存在两条线输出不同的场景? ps:只是澄清一下,是的,我知道 Joe ..
发布时间:2021-12-27 15:43:01 Java开发

执行 os.walk 时出现 UnicodeDecodeError

我收到错误: 'ascii' 编解码器无法解码位置 14 中的字节 0x8b:序号不在范围内 (128) 尝试执行 os.walk 时.发生该错误是因为目录中的某些文件中包含 0x8b(非 utf8)字符.这些文件来自 Windows 系统(因此是 utf-16 文件名),但我已将文件复制到 Linux 系统并使用 python 2.7(在 Linux 中运行)来遍历目录. 我尝试将 u ..
发布时间:2021-12-27 15:42:51 Python

Base64 在 C# 中编码 PDF?

有人可以提供一些有关如何执行此操作的说明吗?我可以对常规文本或字节数组执行此操作,但不确定如何处理 pdf.我要先将 pdf 填充到字节数组中吗? 解决方案 使用 File.ReadAllBytes 加载 PDF 文件,然后使用 Convert.ToBase64String(bytes). ..
发布时间:2021-12-27 15:42:32 C#/.NET

HTML:我应该编码大于还是不大于?( > > )

在编码可能不安全的数据时,是否有理由对 > 进行编码? 它验证任一方式. 浏览器以任何一种方式解释相同,(在 attr="data"、attr='data'、data) 我认为有人会这样做的原因是 简化基于正则表达式的标签移除.]+>?(罕见) 未加引号的字符串attr=data.:-o(没有发生!) 代码中的美学.(那又怎样?) 我错过了什么吗 ..
发布时间:2021-12-27 15:42:26 前端开发

Java:读取器和编码

Java 的默认编码是 ASCII.是的?(见下面我的编辑) 当文本文件以 UTF-8 编码时?读者怎么知道他必须使用UTF-8? 我谈论的读者是: FileReaders BufferedReaders from Sockets 来自 System.in 的 Scanner... 编辑 我们的编码取决于操作系统,这意味着以下内容并非在每个操作系统上都正确: ..
发布时间:2021-12-27 15:42:07 Java开发

将图像转换为数据:image/png;base64 用于网页显示

如果访问 jQuery-File-Upload Demo 页面 并尝试上传一张图片,然后会看 JSON 响应,他会注意到上传图片的预览是以一种格式返回的: "thumbnail_url":"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAFAAAABQCAI... 据我所知,图像被转换成字符串并发送回客户端. 如何在 C# 中实现相同演示的 ..
发布时间:2021-12-27 15:41:59 C#/.NET

为什么 UTF-32 存在,而编码每个字符只需要 21 位?

我们知道代码点可以在这个区间 0..10FFFF 中,小于 2^21.那么当所有的代码点都可以用 3 个字节表示时,为什么我们需要 UTF-32 呢?UTF-24 应该足够了. 解决方案 我能想到的两个原因: 它允许未来的扩展 (更重要的是)计算机通常更擅长处理 4 字节边界上的数据.与处理 3 字节边界的痛苦相比,减少内存消耗方面的好处相对较小. 我想这有点像问为什么我们经 ..
发布时间:2021-12-27 15:41:51 其他开发

Python - 处理混合编码文件

我有一个主要是 UTF-8 的文件,但也找到了一些 Windows-1252 字符. 我创建了一个表来将 Windows-1252 (cp1252) 字符映射到对应的 Unicode 字符,并想用它来修复错误编码的字符,例如 cp1252_to_unicode = {"\x85": u'\u2026', # ..."\x91": u'\u2018', #'"\x92": u'\u2019' ..
发布时间:2021-12-27 15:41:39 Python

将 Binary.toString('encode64') 转换回 Binary

我看过几个 教程 解释了如何将二进制图像转换为 encode64 表示: var image = new Buffer(bl.toString(), 'binary').toString('base64'); 我的问题是,如何返回这个字符串表示,回到它的缓冲区的二进制数据. 解决方案 这个问题有一些有用的信息:如何在 node.js 中进行 Base64 编码? Buffer 类 ..
发布时间:2021-12-27 15:41:30 其他开发

在 R 中转换 HTML 字符实体编码

R 中有没有办法转换 HTML 字符实体编码? 我想转换 HTML 字符实体,例如& 到 & 或> 到 > 对于 Perl 存在可以做到这一点的包 HTML::Entities,但我在 R 中找不到类似的东西. 我也试过 iconv() 但没有得到满意的结果.也许还有一种使用 XML 包的方法,但我还没有想出来. 解决方案 更新:此答案已过时.请根据新的 x ..
发布时间:2021-12-27 15:41:21 前端开发

如何在 Ruby 的字符串中检测某些 Unicode 字符?

给定 Ruby 1.8.7 中的字符串(没有使用 \p{} 支持 Unicode 属性的令人敬畏的 Oniguruma 正则表达式引擎),我希望能够确定该字符串是否包含一个或多个中文、日文或韩文字符;即 class 字符串def contains_cjk?...结尾结尾>>'日本语'.contains_cjk?=>真的>>'광고프로그램'.contains_cjk?=>真的>>'艾弗森将退出篮坛 ..
发布时间:2021-12-27 15:41:03 其他开发

Ruby:如何添加“# 编码:UTF-8"自动地?

是否有任何 gem 自动将 # encoding: UTF-8 添加到每个 Ruby 文件中? 或者有没有其他方法可以防止在整个 Ruby on Rails 项目中出现 invalid multibyte char (US-ASCII) 错误(不仅仅是在单个类中)? 解决方案 试试 magic_encoding gem,它可以插入 uft-8 对应用中所有 ruby​​ 文件的神奇注 ..
发布时间:2021-12-27 15:40:52 其他开发