encoding相关内容
我想保存的HTML文件的prettified打印到一个txt文件,但得到这个错误信息: 回溯(最后最近一次调用): 文件“prettyhtmlfiles.py”,第16行,上述<&模块GT; file.write(汤。prettify()) UNI $ C $岑codeError:“ASCII”codeC无法连接code字符U'\\ XBB“在8532的位置是:序数不在范围内(
..
我创建一个脚本来从网站下载一些MP3播客,并将其写入到一定的位置。我接近完成,并且文件被下载并创建。不过,我运行到那里的二进制数据不能完全去codeD和MP3文件将无法播放的问题。 下面是我的code: 进口重 进口OS 进口的urllib2 从BS4进口BeautifulSoup 进口时间高清getHTMLstring(URL): HTML = urllib2.urlopen(URL
..
我正在运行的Python 2.7.5,并使用内置的HTML解析器什么我即将来形容。 我试图完成的任务是,以HTML的一大块是本质上是一个良方。下面是一个例子。 html_chunk =“< H1>微型薯Knishes< / H1>< P>发贴者bettyboop50在recipegoldmine.com 2001&LT 5月10日; / P><
..
我通过 a.get使用美丽的汤库('href“属性)从一个网页的链接。在链接有一个奇怪的字符®但是当我成为®。我怎样才能连接code得当?我在页的开头已经添加了# - * - 编码:UTF-8 - * - R = requests.get(URL)汤= BeautifulSoup(r.text) 解决方案 待办事项的不的使用 r.text ;离开解码到 BeautifulSoup :
..
使用BeautifulSoup 3.1.0.1和Python 2.5.2,并试图用法语解析网页。然而,当我打电话的findAll,我得到以下错误: 的的Uni $ C $岑codeError:“ASCII”codeC无法连接code字符U'\\ xe9“在1146的位置是:序数不在范围内(128) 下面是code我目前运行的: 进口的urllib2 从BeautifulSoup进口Beaut
..
我的Python(版本2.7)脚本运行良好获得本地HTML文件的一些公司的名字,但是当涉及到一些具体的国家名称,它给这个错误“的Uni $ C $岑codeError:”ASCII“ codeC无法连接code字符“ 特别得到错误时,这家公司的名字来自 公司名称:KühlfixKälteanlagenIng.Gerhard Doczekal&安培; Co. KG的 的链接,不能被处理
..
我试图让文本从一个块引用它看起来像这样的: <块引用类=“postcontent恢复”> 01 Oyasumi < BR>< / BR> 02 DanSin“ < BR>< / BR> 03 w.t.s. < BR>< / BR> 04 Lovism
..
在这里WMIC命令给被写入到一个临时文件的输出,我编写一个批处理文件 WMIC /节点:%%一个卷获得的系统名称,标题,自由空间,容量> TEMP.TXT 临时文件生成,但它的编码是的 UCS-2的Little Endian。 所以,当我试图使用循环读取文本文件, FOR / F“标记= 1”%%的B(TEMP.TXT)做( 回声%%乙 ) 这多年平均值
..
我有读取行的文件,然后一个bat文件试图创建文件或文件夹,根据给定的参数。 的问题是,当它到达字符作为ăâţîş,这是行不通的。 这是我的code: IF“%1”==“”GOTO决赛 IF“%1”==“文件”GOTO文件 IF“%1”==“文件夹”文件夹GOTO:文件 FOR / F %% i的(files.txt)做呼应。 > %% i.rtf GOTO决赛:夹 F
..
我试图做一个死简单的事情:从什么改变文件编码为UTF-8无BOM。我发现了几个脚本,做到这一点,只有真正为我工作的一个是这一个:
..
我想处理包含文件名奇怪的字符,如法国é。 一切都在外壳做工精细: C:\\ somedir \\>任-hélice厚蟹 知道如果我把这个行.bat文件,我得到以下结果: C:\\ somedir \\>任-hÚlicehÚlice 看到了吗? é已取代U 同样是命令的输出如此。如果我 DIR 一些目录中的外壳,输出是好的。 如果我这个输出重定向到一个文件中,出现一些字符
..
在SSH(腻子)我使用一个命令来替换一个文件,该文件是EN $ C $光盘UTF-8 一些文本 例如 CD〜/的public_html /应用/配置; SED -i“S / ADDRESS_SSH / L'住址àETE correctementintégréé/ G'param.php; 在文件中的所有正常,但在浏览器中显示时的口音很奇怪 当verifing文件param.php我发现
..
我正在运行的股票Cygwin的安装,添加包 wget的。 如果我运行一个命令 wget的-qO- tetristv.com/zapni.tv.php 我得到这个;注意字符显示不正确session=OTA5Mjc0ODU5OA==&stream=play
#EXTINF:0,▒T 1< BR>< B><一 HREF =“http://
..
我很安静的新bash的脚本,我想所有的递归我从文件名UTF-8编码转换成文件夹为ASCII(这是非常便携编码)。 我认为iconv命令将一些使用的: 的iconv -f -t UTF8 ASCII ... 但我不知道如何准确地使用它。 最好的情况是bash脚本应该打印一些暗示它的进步,如文件只是转换的名字。结果 非常感谢你。 解决方案 查找/我的/路径型的F> utf8list 的
..
我有一个包含多个图像的TIFF文件,我需要循环通过TIFF文件单独提取图像, 我用的base64 EN code,然后用子串单独的图像和使用的base64德code在文件系统写的, 但是,只有一些图片都可以提取。 例子:我有一个TIFF文件7张图片,但它仅提取4图像。 所以我有恩codeD数据写入到文件和读取,我可以只能够看到II * EN code字符作为4位,而不是7 .. 当我使用
..
我得到一个base64连接codeD字符串,再presents一个RTF文件。 如果我看原文重新presentation(带的base64 code)之前我看到字符序列 FR 。这应该代表毛皮,在浏览器中显示时。 RTF格式文件的标题包含 ansicpg1252 因此除另有变化,这应该是编码(转义序列,字体定义,..)。 我现在的问题是,我不能正确地去code基64字符串到原来的再presen
..
我有一个未加密/ unen codeD字符串 - “565040574”。我也有加密/ EN codeD字符串此字符串 - “BSubW2AUWrSCL7dk9ucoiA ==” 它看起来像这样的字符串加密了之后已经Base64ed,但我不知道是哪个加密算法已被使用。如果我转换“BSubW2AUWrSCL7dk9ucoiA ==”字符串使用 Convert.FromBase64String(“B
..
有 RFC4648 的任何实现(以下简称“Base16,Base32和Base64数据编码” )在Matlab? 解决方案 在MATLAB,你可以很容易地使用嵌入式的 Java功能的。 MATLAB附带 Apache的共享codeC 库中可用的Java类路径。所以,你可以这样做: 海峡='http://stackoverflow.com/q/11659710/'; 。EN codeR =
..
我想带code文本字符串为base64。 我试着这样做: NAME =“你的名字” 打印(“编码为Base64收益率%s =%S \\ n'%(姓名,name.en code('的base64','严'))) 但是,这给了我以下错误: LookupError:'的base64'不是文本编码;使用codecs.en code()来处理任意codeCS 我如何去这样做? (使用Pytho
..
有关官方的base64的填充字符是'=',这可能需要在URL中使用时,必须%的恩codeD。我试图找到最好的填充字符,使我的恩codeD字符串既可以是URL安全的(我将使用EN codeD字符串作为参数值,比如ID = EN codedString )和文件名安全(我会直接使用EN codeD字符串作为文件名)。 点(“。”)是一个热门人选,它的网址安全的,但它不是完全安全的文件名:的 Wind
..