character-encoding相关内容
我正在寻求一些帮助以了解字符集的工作原理.这个问题是 Anything wrong with using windows-1252 而不是 UTF-8 我有一个测试 ColdFusion 站点,使用...
..
我正在尝试将字符串从 ISO-8859-1 编码转换为 UTF-8,但我似乎无法让它工作.这是我在 irb 中所做的一个例子. irb(main):050:0>string = 'Norrlandsvägen'=>《诺兰斯沃根》irb(主):051:0>string.force_encoding('iso-8859-1')=>"Norrlandsv\xC3\xA4gen"irb(主):052:0
..
Logback 1.1.3 LayoutWrappingEncoder 文档t 表示如果用户不设置默认字符集是什么,但源代码说: 默认情况下,此属性的值为 null,对应于系统的默认字符集. 但是我使用的是 PatternLayoutEncoder(带有 RollingFileAppender),它似乎以 UTF-8(以及我的 Windows 7 的默认字符集)输出文件专业系统可能不是
..
似乎 GHC 至少在它决定解码的字符编码上是不一致的. 考虑一个文件,omatase-shimashita.txt,内容如下,UTF-8 编码:お待たせしました readFile 似乎正确读取了这个... 前奏>内容 长度内容8前奏>putStrLn 内容お待たせしま
..
我正在使用遗留应用程序,我正在尝试找出使用 多字节字符集 和 Not Set 编译的应用程序之间的区别 >字符集选项. 我知道使用 Multi byte character set 编译定义了 _MBCS 允许使用多字节字符集代码页,并使用 Not set> 没有定义 _MBCS,在这种情况下,只允许单字节字符集代码页. 在使用 Not Set 的情况下,我假设我们只能使用在此页面上找
..
我在数据库中有 html 编码的字符串,但许多字符实体不仅仅是标准的 & 和 <.“ 和 — 等实体.不幸的是,我们需要将这些数据提供给基于 flash 的 rss 阅读器,而 flash 不会读取这些实体,但它们会读取等效的 unicode(例如 “). 使用 .Net 4.0,是否有任何实用方法可以将 html 编码的字符串转换为使用 u
..
如何在插入时阻止 mysql 将 ' 转换为 '? 我相信它与字符集或什么有关? 我正在使用 php 执行 mysql_insert. 解决方案 您发布的单引号称为 '重音',它经常被一些 Web 应用程序从通用单引号转换而来.它是一个 UTF8 字符,当插入到 Latin-1 数据库中时,它会转换为 '’'.这意味着您需要将 MySQL 的字符集更改为 UTF8,或者将您
..
使用 PHP 5.3 fgetcsv 函数时,由于编码问题,我遇到了一些问题.请注意,该文件具有西班牙语“特殊"拉丁字符,如图形重音 á、é、í ï 等... 我得到的 CSV 文件导出了我在 MS 2008 for Mac Excel 文件中的一些结构化数据. 如果我用 Mac OS X TextEdit 应用程序打开它,一切似乎都很完美. 但是当我开始使用 PHP 程序并尝试
..
我可以更改默认的 open() (io.open() 在 2.7 中) 跨平台的文本编码方式? 这样我就不需要每次都指定open(...,encoding='utf-8'). 在文本模式下,如果未指定 encoding,则使用的编码取决于平台:调用 locale.getpreferredencoding(False) 以获取当前区域设置编码.> 虽然文档没有指定如何设置首选编码.该函
..
我的python列表中有如下字符串(取自命令提示符): >>>o['记录'][5790](5790, 'Vlv-Gate-Assy-Mdl-\xe1M1-2-\xe19/16-10K-BB Credit Memo', 60,是的,'40141613')>>> 我尝试过这里提到的建议:更改 Python 的默认编码? 进一步将默认编码也更改为 utf-16.但仍然 json.dumps
..
我们可以通过以下代码在 INDIVIDUAL CSS 文件中声明字符编码: @charset "UTF-8"; 我的问题是: 如何在 INDIVIDUAL JS 文件中声明字符编码? 如果我给朋友发一个JS文件,希望他(她)在浏览或编辑这个JS文件的时候,能够自己从代码中理解这个JS文件的字符编码. 谢谢! 解决方案 你不能.但是,您可以在 脚本中定义它 标记
..
我正在显示带有 IMAP 的新电子邮件,一切看起来都很好,除了一个邮件主题显示为: =?utf-8?Q?Subject?= 我该如何解决? 解决方案 在 MIME 术语中,那些编码的块称为编码词.您可以像这样解码它们: import email.Headertext, encoding = email.Header.decode_header('=?utf-8?Q?Subje
..
我正在查询使用 SQL_Latin1_General_CP850_BIN2 归类的 SQL Server 数据库.表行之一有一个 varchar,其值包含 +/- 字符(Windows-1252 代码页中的十进制代码 177). 当我直接在 SQL Server Management Studio 中查询表时,我在该行中得到一个乱码字符而不是 +/- 字符.当我将此表用作 SSIS 包中的源
..
unicode 是
,它被用在 XML 文档中. 解决方案 查看图表:unicodelookup.com 它是换行符.
..
有没有人在 Chrome 10/Win 中遇到过这样的事情? 这两个 webfonts 中的所有不间断空格都没有正确呈现.在 IE7/8/9、Firefox、Safari 和 Chrome/OSX 中工作. 我的 fonts.css 文件的内容: @font-face {字体系列:'希腊';src: url('../fonts/eot/hellenic.eot?') 格式('eot'
..
我想确定给定语言环境的字母是什么,最好是基于浏览器的 Accept-Language 标头值.任何人都知道如何做到这一点,必要时使用图书馆吗? 解决方案 看看[LocaleData.getExemplarSet][1] 例如对于英语返回 abcdefghijklmnopqrstuvwxyz [1]:http://icu-project.org/apiref/icu4j/com/
..
这是我的情况:我需要正确确定给定文本文件使用哪种字符编码.希望它可以正确返回以下类型之一: enum CHARACTER_ENCODING{ANSI,统一码,Unicode_big_endian,UTF8_with_BOM,UTF8_without_BOM}; 到目前为止,我可以通过调用以下功能.如果给定的文本文件最初不是 UTF-8 without BOM,它也可以正确确定 ANSI.问题是
..
我想在 Python 3.2 程序中发送具有任意 unicode 正文的电子邮件.但是,实际上,这些消息将主要由 7 位 ASCII 文本组成.所以我想要使用quoted-printable 以utf-8 编码的消息.到目前为止,我发现这有效,但似乎是错误的: c = email.charset.Charset('utf-8')c.body_encoding = email.charset.QP
..
我的 Eclipse 工作区有两个项目,一个使用 CVS,另一个使用 Git.修改CVS项目中的文件并保存时,弹出窗口说 期间发生内部错误:“计算存储库 repo23 的 Git 状态".格式错误的输入或输入包含无法映射的字符:/Users/pb/repo23/对照表/feng11.htm 知道如何解决这个问题吗? 编辑: Eclipse 平台 版本:4.3.1.v20130
..
如何在 Awk 中正确读取 UTF8 以外的编码文件? 我有一个希伯来语/Windows-1255 编码的文件.一个简单的 {print $0} awk 会打印像 之类的东西.我怎样才能让它正确读取? 解决方案 awk 本身不支持处理不同的编码.它将遵守环境中指定的语言环境,但最好的办法是将输入转码为正确的编码,然后再将其交给 awk. -f 是您要转换的格式,-t 是目标格式
..