utf-8相关内容

LayoutWrappingEncoder 的 LogBack 默认字符集?

Logback 1.1.3 LayoutWrappingEncoder 文档t 表示如果用户不设置默认字符集是什么,但源代码说: 默认情况下,此属性的值为 null,对应于系统的默认字符集. 但是我使用的是 PatternLayoutEncoder(带有 RollingFileAppender),它似乎以 UTF-8(以及我的 Windows 7 的默认字符集)输出文件专业系统可能不是 ..
发布时间:2022-01-07 21:49:05 Java开发

有没有办法改变 Python 的 open() 默认文本编码?

我可以更改默认的 open() (io.open() 在 2.7 中) 跨平台的文本编码方式? 这样我就不需要每次都指定open(...,encoding='utf-8'). 在文本模式下,如果未指定 encoding,则使用的编码取决于平台:调用 locale.getpreferredencoding(False) 以获取当前区域设置编码.> 虽然文档没有指定如何设置首选编码.该函 ..
发布时间:2022-01-07 21:48:17 Python

如何在 .net 中生成 UTF-8 字符集中的所有字符

我的任务是生成 UTF-8 字符集中的所有字符,以测试系统如何处理每个字符.我对字符编码没有太多经验.我要尝试的方法是增加一个计数器,然后尝试将那个以十为基数的数字转换为等效的 UTF-8 字符,但到目前为止,我还没有在 C# 3.5 中找到一种有效的方法 任何建议将不胜感激. 解决方案 System.Net.WebClient client = new System.Net.Web ..
发布时间:2022-01-07 21:45:01 C#/.NET

MySQL 工作台字符集

是否有任何方法可以更改 MySQL Workbench 字符集?我的架构使用 UTF-8,当我查看表数据(另存为 UTF-8)或手动添加数据时,出现字符集错误,可能 MySQL Workbench 使用 LATIN1. 解决方案 我认为 OP 在询问 Workbench 在其编辑器中使用的字符集以及如何设置 Workbench 以在 GUI 中使用 UTF-8 - 而不是如何设置使用的默认 ..
发布时间:2022-01-07 21:44:22 数据库

PostgreSQL:编码为“UTF8"的字节序列为 0xc2 0x81 的字符;在编码“WIN1252"方面没有等价物.

在对该表上的特定行执行 SELECT 查询时出现以下异常 错误:编码“UTF8"中字节序列为 0xc2 0x81 的字符在编码“WIN1252"中没有等效项 该行中的 列 之一包含已使用 UTF-8 编码并插入其中的日语字符. 有没有解决这个问题的方法? 解决方案 你应该知道你的数据库使用了什么编码. SHOW server_encoding; 当你连接到你的数据库时,你可以 ..
发布时间:2022-01-07 21:43:29 其他开发

如何从我的输入中过滤表情符号字符以便我可以保存在 MySQL <5.5 中?

我有一个 Django 应用程序,它从 Twitter 的 API 获取推文数据并将其保存在 MySQL 数据库中.据我所知(我仍在深入了解字符编码的细节)我在任何地方都使用 UTF-8,包括 MySQL 编码和整理,除非推文包含 Emojistrong> 字符,据我所知使用四字节编码.尝试保存它们会从 Django 中产生以下警告: /home/biggleszx/.virtualenvs ..
发布时间:2022-01-07 21:42:41 数据库

导入csv表时MySQL无效的UTF8字符串

我想通过以下方式将 .csv 文件导入 MySQL 数据库: load data local infile 'C:\\Users\\t_lichtenberger\\Desktop\\tblEnvironmentLog.csv'进入表 tblenvironmentlog字符集 utf8以“;"结尾的字段以 '\n' 结尾的行忽略 1 行; .csv 文件如下所示: 但我收到以下错误,我无 ..
发布时间:2022-01-07 21:42:32 数据库

在 Java 中将 UTF-8 转换为 ISO-8859-1

我正在阅读 XML 文档 (UTF-8) 并最终使用 ISO-8859-1 在网页上显示内容.正如预期的那样,有几个字符没有正确显示,例如“、–和’(它们显示为?). 是否可以将这些字符从 UTF-8 转换为 ISO-8859-1? 这是我为尝试这样做而编写的一段代码: BufferedReader br = new BufferedReader(new InputStreamRea ..
发布时间:2022-01-07 21:42:05 Java开发

我可以在 Ruby 1.9 上设置默认字符串编码吗?

这听起来可能很小,但它让我发疯了.自从上周五在 Ruby 1.9 上发布应用程序到生产环境后,我遇到了许多与字符编码相关的小异常.几乎所有内容都与以下内容有关: Encoding::CompatibilityError: 不兼容的字符编码:ASCII-8BIT 和 UTF-8 我们有一个国际用户群,所以很多名字都包含变音等.如果我修复模板以在很多地方使用 force_encoding,它会在 ..
发布时间:2022-01-07 21:41:49 其他开发

将字符串从任何编码强制转换为 UTF-8

在我的 rails 应用程序中,我正在处理来自世界各地的 RSS 提要,并且一些提要具有非 UTF-8 格式的链接.原始提要链接不受我控制,为了在应用的其他部分使用它们,它们需要采用 UTF-8. 如何检测编码并转换为 UTF-8? 解决方案 Ruby 1.9 “强制"编码很容易,但它不会转换字符,只是更改编码: str = str.force_encoding('UTF-8 ..
发布时间:2022-01-07 21:41:40 其他开发

UTF-8 编码如何识别单字节和双字节字符?

最近我遇到了一个关于字符编码的问题,当我深入研究字符集和字符编码时,我想到了这个疑问.UTF-8 编码最受欢迎,因为它向后兼容 ASCII.因为 UTF-8是变长编码格式,它是如何区分单字节和双字节字符的.例如,“A"存储为“410754"(A的Unicode是41,阿拉伯字符的Unicode是0754.编码如何识别41是一个字符和0754又是一个二字节字符?为什么不把4107当作双字节字符,把5 ..
发布时间:2022-01-07 21:41:15 其他开发

在脚本中通过 vim 将文件编码更改为 utf-8

在我们的服务器从 Debian 4 更新到 5 后,我被击倒了.我们切换到 UTF-8 环境,现在我们无法在浏览器上正确打印文本,因为所有文件都采用非 utf8 编码,如 iso-8859-1、ascii 等. 我尝试了许多不同的脚本. 我尝试的第一个是“iconv".那个不行,它改变了内容,但文件的编码仍然是非utf8. 我通过 apt-get 安装的 enca、encamv、 ..
发布时间:2022-01-07 21:40:28 其他开发

如何在文本文件中检测无效的 utf8 unicode/binary

我需要检测损坏的文本文件,其中包含无效(非 ASCII)utf-8、Unicode 或二进制字符. �>t�ï¿ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿ï¿½ ..
发布时间:2022-01-07 21:40:21 服务器开发

当 PHP 无法指示正确的编码时如何加载 XML?

我正在尝试从远程位置加载 XML 源,因此我无法控制格式.不幸的是,我尝试加载的 XML 文件没有编码: 在尝试以下操作时: $doc = new DOMDocument( );$doc->load(URI); 我明白了: 输入不是正确的 UTF-8,请指出编码!字节:0xA3 0x38 0x2C 0x38 我已经研究了抑制这种情况的方法,但没有运气.我应该如何加载 ..
发布时间:2022-01-07 21:39:31 PHP

如何用 UTF-8 编码的 Excel 打开文本文件?

我有一个扩展名为“.tsv"的文本文件.它具有 UTF-8 编码并包含西里尔字符.当我尝试使用以下功能打开它时:“打开方式"->“Excel",Excel 没有显示正确的字符,而如果我以相同的方式使用 Notepad++ 打开它,我可以正确地看到字符.我想避免使用向导在 Excel 中导入文件. 解决方案 使用数据,从文本获取外部数据,并为文件源提供正确的编码. ..
发布时间:2022-01-07 21:38:50 其他开发