utf-8相关内容

在 PHP 5.3 和 Windows Vista 中使用日语文件名?

我目前正在尝试编写一个在文件夹中查找的简单脚本,并返回 RSS 提要中所有文件名的列表.但是,我遇到了主要问题...每当我尝试读取包含日文字符的文件名时,它都会将它们显示为 ?'s.我已经尝试过这里提到的解决方案:php readdir question with japanese language file名称 - 但是由于某种原因它们不起作用,即使是: header('Content-Typ ..
发布时间:2021-12-28 16:58:46 PHP

Sublime Text 3、Python 3 和 UTF-8 互不喜欢

我正在尝试使用在 Sublime Text 中运行的 Python 脚本解析 HTML 页面.此页面包含非 ASCII 字符.我一直收到 [Decode error - output not utf-8] 所以我调查了一下,最后发现了这个有趣的代码片段: 导入编解码器#print((1, codecs.decode(codecs.encode('ò', 'utf-8'), 'utf-8')))打 ..
发布时间:2021-12-28 16:58:36 Python

带有 HTML 标题、问号的 Unicode 问题?65533;

我正在尝试解析以下网页中的标题:http://kid37.blogger.de/stories/1670573/ 当我在标题元素上使用 apache.commons.lang StringEscapeUtils.escapeHTML 方法时,我得到以下内容 Das hermetische Caf�:摇滚&摔跤 2010 但是,当我使用 utf-8 编码在我的网页中显 ..
发布时间:2021-12-28 16:58:03 Java开发

检查 SQLite 中文本的编码

我在处理 SQlite 中的非欧洲文本时做噩梦.我认为问题在于 SQlite 没有用 UTF8 编码文本.所以我想检查一下编码是什么,并希望将其更改为utf8.我用 UTF8 编码了一个 CSV 并简单地将它导入到 SQlite 但非罗马文本是乱码. 我想知道:1)如何检查编码.2)如果不是utf8,如何更改编码.我一直在阅读有关 Pragma 编码的文章,但我不确定如何使用它. 我使 ..
发布时间:2021-12-28 16:57:55 数据库

从 Scala 解释器打印 Unicode

使用 scala 解释器时(即在命令行上运行命令“scala"),我无法正确打印 unicode 字符.当然 a-z、A-Z 等打印正确,但例如 € 或 ƒ 打印为 ?. print(8364.toChar) 结果是?而不是€.可能我做错了什么.我的终端支持 utf-8 字符,即使我将输出通过管道传输到一个单独的文件并在文本编辑器中打开它,?显示. 这一切都发生在 Mac OS X (S ..
发布时间:2021-12-28 16:57:45 其他开发

如何让 MySQL 返回 UTF-8?

我正在使用 PHPUnit 来验证来自我的 PHP 代码的 XML 输出,但显然我在字符编码方面遇到了问题 MySQL 返回.这是我从 DOMDocument 得到的错误: 输入的不是正确的UTF-8,提示编码!字节:0xE9 0x20 0x42 0x65 我初始化了 DOMDocument 以使其使用正确的编码: $domDocument = new DOMDocument('1.0',' ..
发布时间:2021-12-28 16:57:39 PHP

如何从 Java 中的 XML 文件中删除 BOM

我需要有关如何从 UTF-8 文件中删除 BOM 并创建其余 xml 文件副本的建议. 解决方案 根据我的经验,由于 UTF-8 文件中的 BOM 而导致工具损坏是一件非常的事情.我不知道为什么有这么多反对票(但它让我有机会尝试获得足够的选票来赢得一个特殊的 SO 徽章;) 更严重的是:UTF-8 BOM 通常没有多大意义但它是完全有效的(尽管不鼓励)规范.现在的问题是,很多人不知道 ..
发布时间:2021-12-28 16:57:32 Java开发

Python,转换4字节字符以避免MySQL错误“字符串值不正确:"

我需要将(在 Python 中)一个 4 字节的字符转换为其他字符.这是将它插入到我的 utf-8 mysql 数据库中而不会出现错误,例如:“不正确的字符串值:'\xF0\x9F\x94\x8E' for column 'line' at row 1" 通过将 4 字节 unicode-to-mysql 插入 mysql 引发警告 显示这样做: >>>进口重新>>>高点 = re.com ..
发布时间:2021-12-28 16:57:23 数据库

使用 Go 删除​​变音符号

如何使用 Go 从给定的 UTF8 编码字符串中删除所有变音符号?例如转换字符串 "žůžo" => "zuzo".有标准的方法吗? 解决方案 您可以使用 Text normalization 中描述的库去. 这是这些库的应用程序: //示例源自:http://blog.golang.org/normalization包主进口 (“fmt"“统一码"“golang.org/x/te ..
发布时间:2021-12-28 16:56:59 其他开发

C# Mysql UTF8 编码

我有一个带有 utf8_general_ci 编码的 mysql 数据库, 我使用 utf-8 页面和文件编码使用 php 连接到同一个数据库,没问题但是当用 C# 连接 mysql 时,我有这样的字母 غزة 我将连接字符串编辑成这样 server=localhost;password=root;User Id=root;Persist Security Info=True; ..
发布时间:2021-12-28 16:56:12 C#/.NET

在 Go 中解组 ISO-8859-1 XML 输入

当您的 XML 输入不是以 UTF-8 编码时,xml 包的 Unmarshal 函数似乎需要一个 CharsetReader. 你在哪里找到这样的东西? 解决方案 更新了 2015 &超越: import (“编码/xml"“golang.org/x/net/html/charset")读者 := bytes.NewReader(theXml)解码器:= xml.NewDecod ..
发布时间:2021-12-28 16:56:04 其他开发

fwrite() 和 UTF8

我正在使用 php fwrite() 创建一个文件,我知道我的所有数据都在 UTF8 中(我已经对此进行了广泛的测试 - 将数据保存到 db 并在普通网页上输出时一切正常并报告为 utf8.),但我被告知我输出的文件包含非 utf8 数据:( bash (CentOS) 中是否有命令可以检查文件格式? 当使用 vim 时,它显示的内容为: Donâ~@~Yt 做任何事.... Itâ~ ..
发布时间:2021-12-28 16:55:46 PHP

PHP mysql 字符集 utf8 问题

可能的重复: UTF-8 全程 我正在其他人已经开发的网站上开发一些新功能. 字符集有问题. 我看到数据库有一些表格是utf8的,有些表格是latin1的 所以我正在尝试将所有表格转换为 UTF8. 我做了一张表(现在这张表的字段也是utf8),但没有成功. 我使用的是普通的 mysql 连接.我必须把任何配置说它必须用utf8连接到数据库?如果是女巫一? ..
发布时间:2021-12-28 16:55:37 PHP

UTF-8 问题 PHP/MySQL

我一直使用 ISO-8859-1 编码,但我现在转而使用 UTF-8. 不幸的是,我无法让它工作. 我的 MySQL 数据库是 UTF-8,我的 PHP 文档是用 UTF-8 编码的,我设置了一个 UTF-8 字符集,但它仍然不起作用. (像 æ/ø/å 这样的特殊字符不起作用) 希望大家帮帮忙! 解决方案 确保与数据库的连接也使用此字符集: $conn = my ..
发布时间:2021-12-28 16:55:28 PHP

检查无效的 UTF8

我正在从 UTF8 格式转换为十六进制的实际值.但是,我需要捕获一些无效的字节序列.有没有一种快速的方法来检查一个字符是否不属于 C++ 中的 UTF8? 解决方案 遵循 Unicode 标准章节中的表格3.(我使用了章节(p103)的 Unicode 5.1.0 版本;它在 Unicode 6.0.0 版本的 p94 上是表 3-7,在 Unicode 6.3 版本中是在 p95 上—— ..
发布时间:2021-12-28 16:55:10 C/C++开发

SSIS - 平面文件总是 ANSI 从不使用 UTF-8 编码

有一个非常简单的 SSIS 包: OLE DB Source 通过视图获取数据,(db 表 nvarchar 或 nchar 中的所有字符串列). 用于格式化现有日期并将其添加到数据集的派生列(数据类型 DT_WSTR). 多播任务将数据集拆分为: OLE DB 命令将行更新为“已处理". 平面文件目标 - 其连接管理器设置为代码页 65001 UTF-8,未选中 Unicode.所 ..
发布时间:2021-12-28 16:55:02 其他开发

Java Spring resttemplate 字符编码

我正在使用 Java Spring Resttemplate 通过 get 请求获取 json.我得到的 JSON 有一些奇怪的东西,而不是像 ü ö ä 或 ß 这样的特殊字符.所以我猜字符编码有问题.我在互联网上找不到任何帮助.我现在使用的代码是: String json = restTemplate.getForObject(overPassStatementPostCode,字符串类,参 ..
发布时间:2021-12-28 16:54:49 Java开发