encoding相关内容

美丽的汤,prettified HTML为TXT,获得编码错误

我想保存的HTML文件的prettified打印到一个txt文件,但得到这个错误信息: 回溯(最后最近一次调用): 文件“prettyhtmlfiles.py”,第16行,上述<&模块GT; file.write(汤。prettify()) UNI $ C $岑codeError:“ASCII”codeC无法连接code字符U'\\ XBB“在8532的位置是:序数不在范围内( ..
发布时间:2016-08-05 19:22:30 其他开发语言

警告:某些字符不能去codeD,并通过替换字符被替换

我创建一个脚本来从网站下载一些MP3播客,并将其写入到一定的位置。我接近完成,并且文件被下载并创建。不过,我运行到那里的二进制数据不能完全去codeD和MP3文件将无法播放的问题。 下面是我的code: 进口重 进口OS 进口的urllib2 从BS4进口BeautifulSoup 进口时间高清getHTMLstring(URL): HTML = urllib2.urlopen(URL ..
发布时间:2016-08-05 19:18:40 Python

BeautifulSoup在Python不正确的解析

我正在运行的Python 2.7.5,并使用内置的HTML解析器什么我即将来形容。 我试图完成的任务是,以HTML的一大块是本质上是一个良方。下面是一个例子。 html_chunk =“< H1>微型薯Knishes< / H1>< P>发贴者bettyboop50在recipegoldmine.com 2001&LT 5月10日; / P>< ..
发布时间:2016-08-05 19:18:18 前端开发

在UTF-8字符编码问题

我通过 a.get使用美丽的汤库('href“属性)从一个网页的链接。在链接有一个奇怪的字符®但是当我成为®。我怎样才能连接code得当?我在页的开头已经添加了# - * - 编码:UTF-8 - * - R = requests.get(URL)汤= BeautifulSoup(r.text) 解决方案 待办事项的不的使用 r.text ;离开解码到 BeautifulSoup : ..
发布时间:2016-08-05 19:08:53 Python

UNI $ C $岑codeError与BeautifulSoup 3.1.0.1和Python 2.5.2

使用BeautifulSoup 3.1.0.1和Python 2.5.2,并试图用法语解析网页。然而,当我打电话的findAll,我得到以下错误: 的的Uni $ C $岑codeError:“ASCII”codeC无法连接code字符U'\\ xe9“在1146的位置是:序数不在范围内(128) 下面是code我目前运行的: 进口的urllib2 从BeautifulSoup进口Beaut ..
发布时间:2016-08-05 19:04:56 Python

UNI $ C $岑codeError:“ASCII”codeC不能在特别的名字EN code字

我的Python(版本2.7)脚本运行良好获得本地HTML文件的一些公司的名字,但是当涉及到​​一些具体的国家名称,它给这个错误“的Uni $ C $岑codeError:”ASCII“ codeC无法连接code字符“ 特别得到错误时,这家公司的名字来自 公司名称:KühlfixKälteanlagenIng.Gerhard Doczekal&安培; Co. KG的 的链接,不能被处理 ..
发布时间:2016-08-05 19:02:05 Python

在批处理文件中的文本/ CSV文件转换为UTF-8格式

在这里WMIC命令给被写入到一个临时文件的输出,我编写一个批处理文件 WMIC /节点:%%一个卷获得的系统名称,标题,自由空间,容量> TEMP.TXT 临时文件生成,但它的编码是的 UCS-2的Little Endian。 所以,当我试图使用循环读取文本文件, FOR / F“标记= 1”%%的B(TEMP.TXT)做( 回声%%乙 ) 这多年平均值 ..
发布时间:2016-08-04 19:15:33 Windows 2008/2003/2000

我如何使用蝙蝠脚本创建具有变音符号文件/文件夹

我有读取行的文件,然后一个bat文件试图创建文件或文件夹,根据给定的参数。 的问题是,当它到达字符作为ăâţîş,这是行不通的。 这是我的code: IF“%1”==“”GOTO决赛 IF“%1”==“文件”GOTO文件 IF“%1”==“文件夹”文件夹GOTO:文件 FOR / F %% i的(files.txt)做呼应。 > %% i.rtf GOTO决赛:夹 F ..
发布时间:2016-08-04 19:15:31 Windows 2008/2003/2000

批处理文件编码

我想处理包含文件名奇怪的字符,如法国é。 一切都在外壳做工精细: C:\\ somedir \\>任-hélice厚蟹 知道如果我把这个行.bat文件,我得到以下结果: C:\\ somedir \\>任-hÚlicehÚlice 看到了吗? é已取代U 同样是命令的输出如此。如果我 DIR 一些目录中的外壳,输出是好的。 如果我这个输出重定向到一个文件中,出现一些字符 ..
发布时间:2016-08-04 16:26:17 Windows 2008/2003/2000

SED和UTF-8编码

在SSH(腻子)我使用一个命令来替换一个文件,该文件是EN $ C $光盘UTF-8 一些文本 例如 CD〜/的public_html /应用/配置; SED -i“S / ADDRESS_SSH / L'住址àETE correctementintégréé/ G'param.php; 在文件中的所有正常,但在浏览器中显示时的口音很奇怪 当verifing文件par​​am.php我发现 ..
发布时间:2016-08-03 12:14:54 Linux/Unix

如何转换递归文件夹中的子树的所有文件名从UTF-8 ASCII在Linux中

我很安静的新bash的脚本,我想所有的递归我从文件名UTF-8编码转换成文件夹为ASCII(这是非常便携编码)。 我认为iconv命令将一些使用的: 的iconv -f -t UTF8 ASCII ... 但我不知道如何准确地使用它。 最好的情况是bash脚本应该打印一些暗示它的进步,如文件只是转换的名字。结果 非常感谢你。 解决方案 查找/我的/路径型的F> utf8list 的 ..
发布时间:2016-08-03 11:20:17 Linux/Unix

无法连接code TIFF文件正确,某些字符不编码

我有一个包含多个图像的TIFF文件,我需要循环通过TIFF文件单独提取图像, 我用的base64 EN code,然后用子串单独的图像和使用的base64德code在文件系统写的, 但是,只有一些图片都可以提取。 例子:我有一个TIFF文件7张图片,但它仅提取4图像。 所以我有恩codeD数据写入到文件和读取,我可以只能够看到II * EN code字符作为4位,而不是7 .. 当我使用 ..
发布时间:2016-08-01 21:48:18 Java开发

RTF文件的编码

我得到一个base64连接codeD字符串,再presents一个RTF文件。 如果我看原文重新presentation(带的base64 code)之前我看到字符序列 FR 。这应该代表毛皮,在浏览器中显示时。 RTF格式文件的标题包含 ansicpg1252 因此除另有变化,这应该是编码(转义序列,字体定义,..)。 我现在的问题是,我不能正确地去code基64字符串到原来的再presen ..
发布时间:2016-08-01 21:45:14 C#/.NET

加密/编码算法

我有一个未加密/ unen codeD字符串 - “565040574”。我也有加密/ EN codeD字符串此字符串 - “BSubW2AUWrSCL7dk9ucoiA ==” 它看起来像这样的字符串加密了之后已经Base64ed,但我不知道是哪个加密算法已被使用。如果我转换“BSubW2AUWrSCL7dk9ucoiA ==”字符串使用 Convert.FromBase64String(“B ..
发布时间:2016-08-01 21:45:11 C#/.NET

RFC 4648(基本[16,32,64])在Matlab中的实现

有 RFC4648 的任何实现(以下简称“Base16,Base32和Base64数据编码” )在Matlab? 解决方案 在MATLAB,你可以很容易地使用嵌入式的 Java功能的。 MATLAB附带 Apache的共享codeC 库中可用的Java类路径。所以,你可以这样做: 海峡='http://stackoverflow.com/q/11659710/'; 。EN codeR = ..
发布时间:2016-08-01 21:44:19 其他开发

如何连接code文本在Python采用base64

我想带code文本字符串为base64。 我试着这样做: NAME =“你的名字” 打印(“编码为Base64收益率%s =%S \\ n'%(姓名,name.en code('的base64','严'))) 但是,这给了我以下错误: LookupError:'的base64'不是文本编码;使用codecs.en code()来处理任意codeCS 我如何去这样做? (使用Pytho ..
发布时间:2016-08-01 21:44:07 Python

什么是对的网址安全和文件名安全base64的最佳人选填充字符?

有关官方的base64的填充字符是'=',这可能需要在URL中使用时,必须%的恩codeD。我试图找到最好的填充字符,使我的恩codeD字符串既可以是URL安全的(我将使用EN codeD字符串作为参数值,比如ID = EN codedString )和文件名安全(我会直接使用EN codeD字符串作为文件名)。 点(“。”)是一个热门人选,它的网址安全的,但它不是完全安全的文件名:的 Wind ..
发布时间:2016-08-01 21:43:31 其他开发