utf-8相关内容

在Java中将UTF-8转换为ISO-8859-1

我正在读一个XML文档(UTF-8),最终使用ISO-8859-1在网页上显示内容。如预期,有几个字符无法正确显示,例如“, - 和'(它们显示为?)。 是否可以将这些字符从UTF-8转换为ISO-8859-1? 我写了一段代码试图这样: BufferedReader br = new BufferedReader(new InputStreamReader(urlConnec ..
发布时间:2016-11-19 13:17:55 Java开发

UTF-8可以编码多少个字符?

如果UTF-8是8位,这并不意味着只能有最多256个不同的字符? 前128个代码点与在ASCII。但它说UTF-8可以支持多达百万个字符。 这是如何工作的? UTF-8不会一直使用一个字节,而是1到4个字节。 前128个字符(US-ASCII)需要一个字节。 接下来的1,920个字符需要两个字节进行编码。这包括几乎所有拉丁字母的其余部分,以及希腊语,西里尔语,科普特语 ..
发布时间:2016-11-19 13:17:32 其他开发

我可以在Ruby 1.9上设置默认字符串编码吗?

这可能听起来很小,但它一直驱使我坚果。自从上周五在Ruby 1.9上发布应用程序以来,我一直有很多关于字符编码的小例外。几乎所有的都是一些变化: Encoding :: CompatibilityError:不兼容的字符编码:ASCII-8BIT和UTF- b $ b 我们有一个国际用户群,所以很多名字包含umlauts等。如果我修复模板使用 force_encoding 在 ..
发布时间:2016-11-19 13:17:10 其他开发

Windows-1252到UTF-8编码

我已将某些文件从Windows机器复制到Linux机器。所以所有的windows编码(windows-1252)文件需要转换为UTF-8。已经在UTF-8中的文件不应该更改。我计划使用“recode”实用程序。如何指定“recode”实用程序应该只转换Windows-1252编码文件而不是UTF-8文件。 重编码的使用示例: recode windows-1252 .. myfile.tx ..
发布时间:2016-11-19 13:16:46 其他开发

通过脚本中的vim将文件编码更改为utf-8

我刚刚在我们的服务器从Debian 4更新到5之后就被淘汰了。 我们切换到UTF-8环境,现在我们在浏览器上正确打印文本有问题,因为所有文件都在非utf8编码,如iso-8859-1,ascii等。 我尝试过许多不同的脚本。 我试过的第一个是“iconv”。 与enca,encamv,convmv和其他一些工具的安装相同的问题我通过安装通过apt-get。 然后我发现了一 ..
发布时间:2016-11-19 13:15:40 其他开发

urllib2开头提供错误的字符集

当我打开网址阅读它,我不能认出它。但是当我检查内容头,它说它被编码为utf-8。所以我试图将其转换为unicode,并抱怨UnicodeDecodeError:'ascii'编解码器无法解码字节0x8b在位置1:序数不在范围(128)使用unicode()。 .encode(“utf-8”)产生 UnicodeDecodeError:'ascii'编解码器无法解码位置1中的字节0x8b:在 ..
发布时间:2016-11-19 13:12:25 Python

UTF-8编码和http参数

我使用YahooUI Javascript库进行简单的ajax调用,如下所示: YAHOO.util.Connect.setForm 'myform'); YAHOO.util.Connect.asyncRequest('POST',url,...); 以下是我的应用程序中的设置: Tomcat版本:6.0.18 Tomcat服务器连接器:URIEnco ..
发布时间:2016-11-19 13:10:50 Java开发

如何检测非西方字符?

我想禁止某些UTF-8输入(服务器端),例如东方语言,其中示例输入可能是“伊”。 但是,我确实希望继续支持其他拉丁语或“拉丁语”字符,例如威尔士语和ŷ,因此无法检查latin-1 。 / p> 我的选择是什么? (如果特定语言,首选PHP) 非常感谢。 推理:很多非西方字符的浏览器支持经常丢失(例如在不同的浏览器上,我只是在上面的问题中看到一个框),所以对于显示名称这样的东 ..
发布时间:2016-11-19 13:07:02 PHP

我应该仍然使用html实体?为什么?

HTML实体仍然有用,还是应该创建UTF-8编码的html文档? 解决方案 如果编码设置正确(并且文档保存为UTF-8),您应该能够只与字符工作。从W3C: 使用UTF-8等编码意味着您可以避免需要大多数转义,只需处理字符。 http://www.w3.org/International/questions/qa-escapes 但是,您仍然需要为特殊字符使用实体如大于/ ..
发布时间:2016-11-19 13:06:36 前端开发

PHP字符编码问题

我需要帮助一个字符编码问题,我想一劳永逸。这里是一个例子,我从一个XML feed,插入我的数据库,然后拉出一些内容。 正如你看不到的,很多特殊的html字符被破坏/破坏。 我如何一劳永逸?我如何支持所有类型的字符等。 我已经尝试过每一个编码我可以找到,它有时纠正它,但大多数,但仍然 $ header('Content-type:text / html; charset = ..
发布时间:2016-11-19 13:06:16 PHP

问题json_encode utf-8

我有一个有特殊字符的json_encode函数的问题。 例如,我尝试这样: $ string =“Svrček”; echo“ENCODING =”。mb_detect_encoding($ string); // ENCODING = UTF-8 echo“JSON =”。json_encode($ string); // JSON =“Svr\\\ček” ..
发布时间:2016-11-19 13:05:35 PHP

UTF8编码问题 - 有很好的例子

我有以下字符编码问题,不知何故我已经设法保存数据与不同的字符编码到我的数据库(UTF8)下面的代码和输出显示2个示例字符串及其如何输出。其中1个将需要更改为UTF8,另一个已经是。 我应该如何检查是否应该对字符串进行编码?例如 我需要每个字符串正确输出,那么如何检查它是否已经是utf8或者是否需要转换? 我使用PHP 5.2,mysql myisam表: CREATE TAB ..
发布时间:2016-11-19 13:05:25 PHP

Spring MVC中的UTF-8编码问题

我是一个Spring MVC bean,我想通过设置编码UTF-8来返回土耳其字符。但是我的字符串是“şŞğĞİıçÇöÖüÜ”,它返回“”çÇöÖüÜ“。并且当我看看响应页面,这是互联网浏览器页面,编码是西欧iso,不是UTF-8。 这是代码: @RequestMapping(method = RequestMethod.GET,value =“/ GetMyList”) pub ..
发布时间:2016-11-19 13:03:37 Java开发

将请求参数作为UTF-8编码字符串传递

我创建了一个简单的登录页面,并且想要将登录名和密码参数作为UTF-8编码的字符串传递。正如你在下面的代码中可以看到的,第一行是我将编码设置为UTF-8,但似乎这是无意义的,因为它不工作。当我使用带有口音的登录和密码参数时,结果页面会收到奇怪的字符。 如何正确设置字符编码的方式适用于所有浏览器? ..
发布时间:2016-11-19 13:03:03 其他开发

如何UTF-8“可变宽度编码”工作?

unicode标准有足够的代码点,你需要4个字节来存储它们。这就是UTF-32编码。然而,UTF-8编码以某种方式通过使用称为“可变宽度编码”的东西将它们挤压到更小的空间中。 事实上,它管理在一个字节中表示US-ASCII的前127个字符,看起来像真正的ASCII,所以你可以解释很多ascii文本如果是UTF-8没有做任何事情。整洁的技巧。那么它是如何工作的? 我会问这里回答我自己的问 ..
发布时间:2016-11-19 13:02:17 其他开发