character-encoding相关内容

当 PHP 无法指示正确的编码时如何加载 XML?

我正在尝试从远程位置加载 XML 源,因此我无法控制格式.不幸的是,我尝试加载的 XML 文件没有编码: 在尝试以下操作时: $doc = new DOMDocument( );$doc->load(URI); 我明白了: 输入不是正确的 UTF-8,请指出编码!字节:0xA3 0x38 0x2C 0x38 我已经研究了抑制这种情况的方法,但没有运气.我应该如何加载 ..
发布时间:2022-01-07 21:39:31 PHP

如何用 UTF-8 编码的 Excel 打开文本文件?

我有一个扩展名为“.tsv"的文本文件.它具有 UTF-8 编码并包含西里尔字符.当我尝试使用以下功能打开它时:“打开方式"->“Excel",Excel 没有显示正确的字符,而如果我以相同的方式使用 Notepad++ 打开它,我可以正确地看到字符.我想避免使用向导在 Excel 中导入文件. 解决方案 使用数据,从文本获取外部数据,并为文件源提供正确的编码. ..
发布时间:2022-01-07 21:38:50 其他开发

欧元符号 € 的十六进制表示

我使用 XVI32(十六进制编辑器)来获取欧元符号的十六进制表示,它给我的值为 80. 另一个站点:http://www.string-functions.com/string-hex.aspx 也一样. 我无法理解为什么十六进制表示是 80 而不是 0x20AC.这个 0X80 给出十进制的 128,如果我使用 Alt+0128 它实际上产生欧元符号. 有人能解释一下这种从字符串到十六 ..
发布时间:2022-01-07 21:38:40 其他开发

如何在 Python 中处理 Unicode(非 ASCII)字符?

我正在使用 Python 进行编程,我正在从网页通过 urllib2 库.问题是该页面可以为我提供非 ASCII 字符,例如 'ñ'、'á' 等.就在 urllib2code> 得到这个字符,它会引发一个异常,像这样: 文件“c:\Python25\lib\httplib.py",第711行,发送self.sock.sendall(str)文件“",第 1 行,在 sendall ..
发布时间:2022-01-07 21:38:33 Python

将 C++ std::string 转换为 UTF-16-LE 编码的字符串

我今天已经搜索了几个小时,但找不到任何适合我的东西.我刚刚看过的一个,没有运气,是“如何将 UTF-8 编码的 std::string 转换为 UTF-16 std::string". 我的问题是,简要说明: 我想在 std C++ 中创建一个有效的 NTLM 哈希,并且我正在使用 OpenSSL 的库来使用其 MD4 例程创建哈希.我知道怎么做,那么有谁知道如何将 std::stri ..
发布时间:2022-01-07 21:38:23 C/C++开发

如何获取 VB6 正在使用的字符集?

我需要找出我的 VB6 应用程序使用的字符集(编码)是什么.有什么功能吗?类似于 VB.net 中的 Encoding.Default? 我正在将此程序转换为 Java,它们都打印相同的 ASCII 代码,但结果不同(Java 使用字符集 windows-1252). 谢谢 解决方案 从内部来看,VB6 中的字符串是 Unicode、UCS-2. 从系统的角度来看,VB6 ..
发布时间:2022-01-07 21:38:08 其他开发

fgetcsv() 删除带有变音符号的字符(即非 ASCII) - 如何修复?

类似问题: PHP 过程中无法读取 CSV 文件中的某些字符fgetcsv() , fgetcsv() 忽略特殊字符当它们位于行首时 我的应用程序有一个表单,用户可以在其中上传 CSV 文件(其 5 个内部用户始终上传了一个有效文件 - 逗号分隔、引用、记录以 LF 结尾),然后使用PHP: $fhandle = fopen($uploaded_file,'r');while($row ..
发布时间:2022-01-07 21:37:50 PHP

将 Unicode 转换为用于 vCard 的 Windows-1252

我正在尝试用 C# 编写一个程序,该程序会将包含多个联系人的 vCard (VCF) 文件拆分为每个联系人的单独文件.我知道大多数手机需要将电子名片保存为 ANSI (1252) 才能读取它们. 但是,如果我使用 StreamReader 打开一个 VCF 文件,然后使用 StreamWriter(设置 1252 作为编码格式)将其写回,所有特殊字符如 å、æ 和 ø 被写成 ?.ANSI ..
发布时间:2022-01-07 21:37:36 C#/.NET

utf8_encode 函数用途

假设我用 UTF-8 编码我的文件. 在 PHP 脚本中,将比较字符串: $string="ぁ";$string = utf8_encode($string);//我需要这一步吗?if(preg_match('/ぁ/u',$string))//如果匹配就做... 它是没有 utf8_encode() 函数的 string 真的是 UTF-8 吗?如果你用 UTF-8 编码你的文件不需要这 ..
发布时间:2022-01-07 21:37:19 PHP

如何将 UTF8 转换为 Unicode

我尝试将 UTF8 字符串转换为 Java Unicode 字符串. String question = request.getParameter("searchWord");byte[] bytes = question.getBytes();question = new String(bytes, "UTF-8"); 输入的是汉字,当我比较每个字符的十六进制代码时,它是相同的汉字.所以我很 ..
发布时间:2022-01-07 21:37:12 Java开发

为什么 Windows 需要使用 utf8_decode 文件名才能让 `file_get_contents` 工作?

如果 $filename 包含变音符号 (ä,ö,ü) file_get_contents($filename) 在我的 Windows 操作系统上不起作用.通过反复试验,我发现我需要做 file_get_contents(utf8_decode($filename)) 才能让它工作. 但是,当我将其实时推送到我的服务器(猜测它是某种 Linux)时,它再次返回错误,所以我删除了 utf8_ ..
发布时间:2022-01-07 21:37:02 PHP

HTTP URL - 参数名称中允许的字符

对于 URL 参数名称中允许使用哪些字符,是否有任何正式限制? 我一直在阅读 RFC3986(“统一资源标识符 (URI): 通用语法"),但没有得出明确的结论. 我知道有实际限制,但实际上是否会禁止执行以下操作: param with\funny=some_value 只要我正确转义: param%20with%1cfunny%3cchars%3e=some_value 解决 ..
发布时间:2022-01-07 21:36:33 其他开发

如何在php页面上显示日文字符?

我正在尝试在 PHP 页面上显示日语字符.没有从数据库加载,只是存储在一个语言文件中并被回显. 我遇到了一个奇怪的场景.我使用 UTF-8 正确设置了页面,并在我的本地 WAMP 服务器上测试了一个示例页面,它可以正常工作. 当我测试我们的开发和生产服务器时,字符显示不正确. 这让我相信这是 php.ini 中的一个设置.但是我还没有找到太多关于此的信息,所以我不确定这是否是问题 ..
发布时间:2022-01-07 21:35:52 PHP

解压 mojibake

当您解码错误的字符时,您如何识别原始字符串的可能候选者? Ä×èÈÄÄî▒è¤ô_üiâAâjâüâpâXüj_10òb.png 我知道这个图像文件名应该是一些日文字符.但是由于对 urllib 引用/取消引用、编码和解码 iso8859-1、utf8 的各种猜测,我一直无法取消并获得原始文件名. 腐败是可逆的吗? 解决方案 您可以使用 chardet(使用 pip 安装): ..
发布时间:2022-01-07 21:35:41 Python