utf-8相关内容
我正在读一个XML文档(UTF-8),最终使用ISO-8859-1在网页上显示内容。如预期,有几个字符无法正确显示,例如“, - 和'(它们显示为?)。 是否可以将这些字符从UTF-8转换为ISO-8859-1? 我写了一段代码试图这样: BufferedReader br = new BufferedReader(new InputStreamReader(urlConnec
..
如果UTF-8是8位,这并不意味着只能有最多256个不同的字符? 前128个代码点与在ASCII。但它说UTF-8可以支持多达百万个字符。 这是如何工作的? UTF-8不会一直使用一个字节,而是1到4个字节。 前128个字符(US-ASCII)需要一个字节。 接下来的1,920个字符需要两个字节进行编码。这包括几乎所有拉丁字母的其余部分,以及希腊语,西里尔语,科普特语
..
这可能听起来很小,但它一直驱使我坚果。自从上周五在Ruby 1.9上发布应用程序以来,我一直有很多关于字符编码的小例外。几乎所有的都是一些变化: Encoding :: CompatibilityError:不兼容的字符编码:ASCII-8BIT和UTF- b $ b 我们有一个国际用户群,所以很多名字包含umlauts等。如果我修复模板使用 force_encoding 在
..
我已将某些文件从Windows机器复制到Linux机器。所以所有的windows编码(windows-1252)文件需要转换为UTF-8。已经在UTF-8中的文件不应该更改。我计划使用“recode”实用程序。如何指定“recode”实用程序应该只转换Windows-1252编码文件而不是UTF-8文件。 重编码的使用示例: recode windows-1252 .. myfile.tx
..
我刚刚在我们的服务器从Debian 4更新到5之后就被淘汰了。 我们切换到UTF-8环境,现在我们在浏览器上正确打印文本有问题,因为所有文件都在非utf8编码,如iso-8859-1,ascii等。 我尝试过许多不同的脚本。 我试过的第一个是“iconv”。 与enca,encamv,convmv和其他一些工具的安装相同的问题我通过安装通过apt-get。 然后我发现了一
..
Java如何确定 System.out ?使用的编码给定以下类: import java.io.File; import java.io.PrintWriter; public class Foo { public static void main(String [] args)throws Exception { String s =“xxäñxx”; Sys
..
我正在尝试从远程位置加载XML源,因此我无法控制格式。不幸的是我试图加载的XML文件没有编码: 当尝试类似: $ doc = new DOMDocument(); $ doc-> load(UR
..
我需要使用VB.NET将UTF8字符串转换为ISO-8859-1字符串。 任何示例? 强调的文字我尝试了拉丁语功能,但没有运行。我收到不正确的字符串。 我的例子是我需要使用API发送短信。 此代码: baseurl =“http://www.myweb.com/api/sendsms.php” client = New WebClient client.H
..
当我打开网址阅读它,我不能认出它。但是当我检查内容头,它说它被编码为utf-8。所以我试图将其转换为unicode,并抱怨UnicodeDecodeError:'ascii'编解码器无法解码字节0x8b在位置1:序数不在范围(128)使用unicode()。 .encode(“utf-8”)产生 UnicodeDecodeError:'ascii'编解码器无法解码位置1中的字节0x8b:在
..
我使用YahooUI Javascript库进行简单的ajax调用,如下所示: YAHOO.util.Connect.setForm 'myform'); YAHOO.util.Connect.asyncRequest('POST',url,...); 以下是我的应用程序中的设置: Tomcat版本:6.0.18 Tomcat服务器连接器:URIEnco
..
我有一个问题,发送特殊字符,如西里尔字母或umlauts从一个jsp到一个servlet。 我非常感谢您在这里的帮助。 这是我所做的: 在jsp中定义utf-8字符集:
..
我想禁止某些UTF-8输入(服务器端),例如东方语言,其中示例输入可能是“伊”。 但是,我确实希望继续支持其他拉丁语或“拉丁语”字符,例如威尔士语和ŷ,因此无法检查latin-1 。 / p> 我的选择是什么? (如果特定语言,首选PHP) 非常感谢。 推理:很多非西方字符的浏览器支持经常丢失(例如在不同的浏览器上,我只是在上面的问题中看到一个框),所以对于显示名称这样的东
..
HTML实体仍然有用,还是应该创建UTF-8编码的html文档? 解决方案 如果编码设置正确(并且文档保存为UTF-8),您应该能够只与字符工作。从W3C: 使用UTF-8等编码意味着您可以避免需要大多数转义,只需处理字符。 http://www.w3.org/International/questions/qa-escapes 但是,您仍然需要为特殊字符使用实体如大于/
..
我需要帮助一个字符编码问题,我想一劳永逸。这里是一个例子,我从一个XML feed,插入我的数据库,然后拉出一些内容。 正如你看不到的,很多特殊的html字符被破坏/破坏。 我如何一劳永逸?我如何支持所有类型的字符等。 我已经尝试过每一个编码我可以找到,它有时纠正它,但大多数,但仍然 $ header('Content-type:text / html; charset =
..
我有一个有特殊字符的json_encode函数的问题。 例如,我尝试这样: $ string =“Svrček”; echo“ENCODING =”。mb_detect_encoding($ string); // ENCODING = UTF-8 echo“JSON =”。json_encode($ string); // JSON =“Svr\\\ček”
..
我有以下字符编码问题,不知何故我已经设法保存数据与不同的字符编码到我的数据库(UTF8)下面的代码和输出显示2个示例字符串及其如何输出。其中1个将需要更改为UTF8,另一个已经是。 我应该如何检查是否应该对字符串进行编码?例如 我需要每个字符串正确输出,那么如何检查它是否已经是utf8或者是否需要转换? 我使用PHP 5.2,mysql myisam表: CREATE TAB
..
我是一个Spring MVC bean,我想通过设置编码UTF-8来返回土耳其字符。但是我的字符串是“şŞğĞİıçÇöÖüÜ”,它返回“”çÇöÖüÜ“。并且当我看看响应页面,这是互联网浏览器页面,编码是西欧iso,不是UTF-8。 这是代码: @RequestMapping(method = RequestMethod.GET,value =“/ GetMyList”) pub
..
我创建了一个简单的登录页面,并且想要将登录名和密码参数作为UTF-8编码的字符串传递。正如你在下面的代码中可以看到的,第一行是我将编码设置为UTF-8,但似乎这是无意义的,因为它不工作。当我使用带有口音的登录和密码参数时,结果页面会收到奇怪的字符。 如何正确设置字符编码的方式适用于所有浏览器?
..
mysql中的 utf8mb4 和 utf8 字符集之间有什么区别? 我已经了解 ASCII,UTF-8,UTF-16 和 UTF-32 编码; 但是我很想知道'utf8mb4'组的编码与在mysql服务器中定义的其他编码类型的区别。 使用utf8mb4而不是utf8的任何特殊好处/建议? 解决方案
..
unicode标准有足够的代码点,你需要4个字节来存储它们。这就是UTF-32编码。然而,UTF-8编码以某种方式通过使用称为“可变宽度编码”的东西将它们挤压到更小的空间中。 事实上,它管理在一个字节中表示US-ASCII的前127个字符,看起来像真正的ASCII,所以你可以解释很多ascii文本如果是UTF-8没有做任何事情。整洁的技巧。那么它是如何工作的? 我会问这里回答我自己的问
..