character-encoding相关内容

编码给出“'ascii'编解码器无法编码字符......序数不在范围内(128)";

我正在处理 Django RSS 阅读器项目 这里. RSS 提要会显示类似“OKLAHOMA CITY (AP) — James Harden let"的内容.RSS 提要的编码读取 encoding="UTF-8" 所以我相信我在下面的代码片段中将 utf-8 传递给 markdown.em 破折号是它窒息的地方. 我收到 Django 错误“'ascii' codec can't ..
发布时间:2022-01-07 21:21:20 Python

确定字符串中的字符是否都属于特定字符集

我需要能够在 Java 中获取一个字符串并确定其中包含的所有字符是否都在指定的字符集(例如 ISO-8859-1)中.我已经四处寻找一种简单的方法来做到这一点(包括使用 CharsetDecoder),但还没有找到一些东西. 获取字符串并确定所有字符是否在给定字符集中的最佳方法是什么? 解决方案 Class CharsetEncoder 包 java.nio.charset 提供了一 ..
发布时间:2022-01-07 21:21:11 Java开发

iconv_strlen 函数导致执行超时,在 MAMP 上运行

有人在运行 MAMP 时遇到过 iconv_strlen 函数的问题吗? 解决方案 我遇到了超时问题,但没有抛出任何异常.我在 Zend Framework 站点上工作.通过深入跟踪调试器,我将问题追溯到 iconv_strlen 的使用.它不是在任何奇怪的字符串上调用,它是一个用于验证主机名的简单函数. 为了验证这个问题,我尝试了一个简单的 iconv_strlen("test", ..
发布时间:2022-01-07 21:20:38 PHP

Java char 以什么编码存储?

Java char 类型是否保证以任何特定编码存储? 编辑:我错误地表述了这个问题.我想问的是char文字是否保证使用任何特定的编码? 解决方案 “存储"在哪里?Java 中的所有字符串都以 UTF-16 表示.当写入文件、通过网络发送或其他任何方式时,它会使用您指定的任何字符编码发送. 编辑:专门针对 char 类型,请参阅 字符文档.具体来说:“char 数据类型..... ..
发布时间:2022-01-07 21:20:29 Java开发

如何使用法语口音对数组进行 json_encode?

我有一个带有法国口音的数组项([WIPDescription] => Recette Soupe à lOignon Sans Boeuf US).正在从数据库 (mysql) 中正确提取数据. 但是,当我尝试使用 json_encode 中内置的 php 将其编码为 json 时,它会生成一个 null json 值(OS X 服务器:php 5.3.4,启用 json 1.2.1). ..
发布时间:2022-01-07 21:20:03 PHP

Android InputStream 丢弃前两个字节(修改后的 BluetoothChat)

我使用 BluetoothChat 示例中的代码从蓝牙秤发送和接收字节数据.秤从设备接收命令,然后发回一个字节数组.{2,198,48,48,48,48,199,3}在我们的通信协议中,2 = STX,198 = 数据包开始,199 = 数据包结束,3 = ETX. 一切正常,除了 BluetoothChatService.java 中的以下代码反应奇怪,因为它丢弃了前两个字节. /*** ..
发布时间:2022-01-07 21:19:47 移动开发

为什么像撇号和连字符这样的符号在我的网站上被替换为黑色菱形?

我创建的网站存在一些问题...在其中一个页面上,只要有撇号 (') 或破折号 (-),符号被替换为一个奇怪的黑色菱形,中间有一个问号 这就是我的意思 网站上出现这些符号的地方似乎都在发生这种情况.我以前从未见过这个,谁能给我解释一下? 关于如何修复它的建议也将不胜感激. 参见 http://test.rfinvestments.co.za/index.php?c=team ..
发布时间:2022-01-07 21:19:17 前端开发

如何将 latin1_swedish_ci 数据转换为 utf8_general_ci?

我有一个 MySQL 数据库,其中所有表字段的排序规则都为 latin1_swedish_ci 它已经存储了将近 1000 条记录,现在我想将所有这些数据转换为 utf8_general_ci 这样我就可以显示任何语言的内容.我已经将字段排序规则更改为 utf8_general_ci 但这不会将所有旧记录CONVERT 转换为 utf8_general_ci 解决方案 一件有趣的事 ..
发布时间:2022-01-07 21:19:08 PHP

“剪切和粘贴"是如何进行的?影响字符编码,会出现什么问题?

我有一个在工具 A 中显示的编码 A 的文档 A 和在工具 B 中显示的编码 B 的文档 B.如果我将 B 的(部分)剪切并粘贴到 A 中,可能会产生什么字符编码?我意识到这取决于工具 A 和工具 B 以及粘贴缓冲区中保存的信息(可能包含编码?)和操作系统. 高质量的工具应该做什么?在实践中,有多少常用工具(例如 Word、TextPad、各种 IDE 等)做得很好? 解决方案 首先 ..
发布时间:2022-01-07 21:19:00 其他开发

在 MySQL 数据库中保存口音

我正在尝试将法语口音保存在我的数据库中,但它们并没有像在数据库中那样保存. 例如,“é"被保存为“é". 我尝试将我的文件设置为“Unicode (utf-8)",数据库中的字段是“utf8_general_ci"以及数据库本身. 当我查看发布的数据时通过带有 Firebug 的 AJAX,我看到重音以“é"的形式传递,所以它是正确的. 谢谢,让我知道您需要更多信息! 解决方案 ..
发布时间:2022-01-07 21:18:54 PHP

python3构建的Sublime Text 2编码错误

从 Sublime Text 2 运行我的 python3 脚本时,出现以下错误: UnicodeEncodeError: 'ascii' 编解码器无法对位置 0-2 中的字符进行编码:序号不在范围内 (128) 此外,当从终端运行相同的脚本时,问题不会出现. Sublime 的构建系统设置如下: {"cmd": ["python3", "-u", "$file"],"file_reg ..
发布时间:2022-01-07 21:18:40 Python

如何检测“"(unicode的组合)在c++字符串中

我试图检测一些 Unicode 字符的组合(如 ​)来清理字符串,对于单个 Unicode 字符,它正在检测但未检测到 Unicode 组合. 这些字符串我用来从另一个需要清理的 HTML 页面制作 HTML 页面.我只想清理具有这种在浏览器的 html 页面中甚至不可见的 unicode 的字符串. 以下是示例代码: void detect_Unicode(string& st ..
发布时间:2022-01-07 21:16:20 C/C++开发

我如何在 .NET 中替换口音(德语)

我需要将字符串中的重音符号替换为其对应的英文 例如 ä = ae ö = oe Ö = Oe ü = ue 我知道从字符串中去除它们,但我不知道替换. 如果您有任何建议,请告诉我.我正在用 C# 编码 解决方案 如果您需要在较大的字符串上使用它,多次调用 Replace() 会很快变得效率低下.您最好逐个字符地重建字符串: var map = n ..
发布时间:2022-01-07 21:15:39 C#/.NET

为什么 Unicode 被限制为 0x10FFFF?

为什么最大 Unicode 代码点被限制为 0x10FFFF?是否可以在此代码点上方表示 Unicode - 例如0x10FFFF + 0x000001 = 0x110000 - 通过任何编码方案,如 UTF-16、UTF-8? 解决方案 这是因为 UTF-16. 基本多语言平面 (BMP) 之外的字符使用 代理对 UTF-16 中的第一个代码单元 (CU) 位于 0xD800–0xDBF ..
发布时间:2022-01-07 21:15:31 其他开发

将非 ASCII 字符(变音、重音...)转换为最接近的 ASCII 等效字符(slug 创建)

我正在JavaScript 中寻找方法将字符串中的非ASCII 字符转换为最接近的等价物,类似于PHPiconv 函数可以.例如,如果输入字符串是 Rånades på Skyttis i Ö-vik,则应将其转换为 Rånades pa skyttis i o-vik.我查看了 phpjs 但不包括 iconv. 是否可以在 JavaScript 中执行此类转换,如果可以,如何执行? ..
发布时间:2022-01-07 21:14:58 前端开发