character-encoding相关内容

如何检查客户端的 NLS_LANG?

我正在使用 Windows 操作系统,我知道此设置存储在注册表中.问题是注册表路径随着版本的不同而变化,浏览那一堆注册表项绝对不是一个好主意. 我可以通过 SELECT USERENV ('language') FROM DUAL 获取服务器的 NLS_LANG. 我想将它与客户端设置进行比较,并在它们不匹配时显示警告,就像 Pl/Sql Developer 一样. 解决方案 ..
发布时间:2022-01-07 21:42:55 数据库

如何从我的输入中过滤表情符号字符以便我可以保存在 MySQL <5.5 中?

我有一个 Django 应用程序,它从 Twitter 的 API 获取推文数据并将其保存在 MySQL 数据库中.据我所知(我仍在深入了解字符编码的细节)我在任何地方都使用 UTF-8,包括 MySQL 编码和整理,除非推文包含 Emojistrong> 字符,据我所知使用四字节编码.尝试保存它们会从 Django 中产生以下警告: /home/biggleszx/.virtualenvs ..
发布时间:2022-01-07 21:42:41 数据库

导入csv表时MySQL无效的UTF8字符串

我想通过以下方式将 .csv 文件导入 MySQL 数据库: load data local infile 'C:\\Users\\t_lichtenberger\\Desktop\\tblEnvironmentLog.csv'进入表 tblenvironmentlog字符集 utf8以“;"结尾的字段以 '\n' 结尾的行忽略 1 行; .csv 文件如下所示: 但我收到以下错误,我无 ..
发布时间:2022-01-07 21:42:32 数据库

如何用java将汉字保存到文件中?

我用下面的代码把汉字存成.txt文件,但是用写字板打开的时候看不懂. StringBuffer Shanghai_StrBuf = new StringBuffer("\u4E0A\u6D77");布尔附加 = 真;FileOutputStream fos;fos = new FileOutputStream(FileName, Append);for (int i = 0;i 我能做什么? ..
发布时间:2022-01-07 21:42:15 Java开发

在 Java 中将 UTF-8 转换为 ISO-8859-1

我正在阅读 XML 文档 (UTF-8) 并最终使用 ISO-8859-1 在网页上显示内容.正如预期的那样,有几个字符没有正确显示,例如“、–和’(它们显示为?). 是否可以将这些字符从 UTF-8 转换为 ISO-8859-1? 这是我为尝试这样做而编写的一段代码: BufferedReader br = new BufferedReader(new InputStreamRea ..
发布时间:2022-01-07 21:42:05 Java开发

我可以在 Ruby 1.9 上设置默认字符串编码吗?

这听起来可能很小,但它让我发疯了.自从上周五在 Ruby 1.9 上发布应用程序到生产环境后,我遇到了许多与字符编码相关的小异常.几乎所有内容都与以下内容有关: Encoding::CompatibilityError: 不兼容的字符编码:ASCII-8BIT 和 UTF-8 我们有一个国际用户群,所以很多名字都包含变音等.如果我修复模板以在很多地方使用 force_encoding,它会在 ..
发布时间:2022-01-07 21:41:49 其他开发

将字符串从任何编码强制转换为 UTF-8

在我的 rails 应用程序中,我正在处理来自世界各地的 RSS 提要,并且一些提要具有非 UTF-8 格式的链接.原始提要链接不受我控制,为了在应用的其他部分使用它们,它们需要采用 UTF-8. 如何检测编码并转换为 UTF-8? 解决方案 Ruby 1.9 “强制"编码很容易,但它不会转换字符,只是更改编码: str = str.force_encoding('UTF-8 ..
发布时间:2022-01-07 21:41:40 其他开发

PHP 中的 iconv() 和 mb_convert_encoding() 有什么区别?

iconv() 和 mb_convert_encoding() 在 PHP 中有什么区别?性能是否更好、更快等(例如,使用特定编码)?在什么情况下,一种会比另一种更受欢迎? 以下是我认为我已经知道的: iconv() 包含在大多数 PHP 安装中. 当找到无法映射到新字符集的字符时,您可以指定是将它们转换为“类似"字符还是忽略它们. mb_convert_encoding ..
发布时间:2022-01-07 21:41:34 PHP

使用通用编码检测器 (chardet) 在 Python 中检测文本文件中的字符

我正在尝试使用 Python 中的通用编码检测器 (chardet) 来检测文本文件 ('infile') 中最可能的字符编码,并将其用于进一步处理. 虽然 chardet 主要用于检测网页的字符编码,但我发现了一个 示例 用于单个文本文件. 但是,我不知道如何告诉脚本将最可能的字符编码设置为变量“charenc"(在整个脚本中多次使用). 基于上述示例和 chardet 自己的 ..
发布时间:2022-01-07 21:41:22 Python

UTF-8 编码如何识别单字节和双字节字符?

最近我遇到了一个关于字符编码的问题,当我深入研究字符集和字符编码时,我想到了这个疑问.UTF-8 编码最受欢迎,因为它向后兼容 ASCII.因为 UTF-8是变长编码格式,它是如何区分单字节和双字节字符的.例如,“A"存储为“410754"(A的Unicode是41,阿拉伯字符的Unicode是0754.编码如何识别41是一个字符和0754又是一个二字节字符?为什么不把4107当作双字节字符,把5 ..
发布时间:2022-01-07 21:41:15 其他开发

json_encode(): 参数中的 UTF-8 序列无效

我正在使用 utf8_general_ci 归类对来自 MySQL 数据库的数据调用 json_encode().问题是有些行有我无法清理的奇怪数据.例如符号 ,所以一旦它到达 json_encode(),它就会失败并返回 json_encode(): Invalid UTF-8 sequence in argument. 我已经尝试过 utf8_encode() 和 utf8_decode ..
发布时间:2022-01-07 21:41:00 PHP

Java - 什么是字符、代码点和代理?它们之间有什么区别?

我试图找到术语“字符"、“代码点"和“代理"的解释,虽然这些术语不仅限于 Java,但如果有任何特定于语言的差异,我想要与 Java 相关的解释. 我发现了一些关于字符和代码点之间差异的信息,字符是向人类用户显示的内容,而代码点是对特定字符进行编码的值,但我对代理一无所知.什么是代理,它们与字符和代码点有何不同?我对字符和代码点有正确的定义吗? 在 another thread 关于将 ..
发布时间:2022-01-07 21:40:54 Java开发

在脚本中通过 vim 将文件编码更改为 utf-8

在我们的服务器从 Debian 4 更新到 5 后,我被击倒了.我们切换到 UTF-8 环境,现在我们无法在浏览器上正确打印文本,因为所有文件都采用非 utf8 编码,如 iso-8859-1、ascii 等. 我尝试了许多不同的脚本. 我尝试的第一个是“iconv".那个不行,它改变了内容,但文件的编码仍然是非utf8. 我通过 apt-get 安装的 enca、encamv、 ..
发布时间:2022-01-07 21:40:28 其他开发

如何在文本文件中检测无效的 utf8 unicode/binary

我需要检测损坏的文本文件,其中包含无效(非 ASCII)utf-8、Unicode 或二进制字符. �>t�ï¿ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿ï¿½ ..
发布时间:2022-01-07 21:40:21 服务器开发

Unicode 字符集 &在浏览器中编码

我试图找出在浏览器中如何实现字符集/编码,特别是 Unicode. 集合/编码是在每个浏览器中单独实现还是特定于操作系统? 是否可以找出正在使用的 Unicode Character Db (UCD) 版本? UCD 更新如何推送到每个浏览器/操作系统?(它是通过自动更新推出的,还是只是针对您使用的任何版本的浏览器/操作系统进行设置?) 每个浏览器/操作系统制造商的字符集/编码信息的链 ..
发布时间:2022-01-07 21:39:44 其他开发