encoding 第179页 - IT屋-程序员软件开发技术分享社区

美丽的汤，prettified HTML为TXT，获得编码错误

我想保存的HTML文件的prettified打印到一个txt文件，但得到这个错误信息：回溯（最后最近一次调用）：文件“prettyhtmlfiles.py”，第16行，上述＆lt;＆模块GT; file.write（汤。prettify（）） UNI $ C $岑codeError：“ASCII”codeC无法连接code字符U'\\ XBB“在8532的位置是：序数不在范围内（ ..

发布时间：2016-08-05 19:22:30 python-2.7 encoding utf-8 beautifulsoup 其他开发语言

警告：某些字符不能去codeD，并通过替换字符被替换

我创建一个脚本来从网站下载一些MP3播客，并将其写入到一定的位置。我接近完成，并且文件被下载并创建。不过，我运行到那里的二进制数据不能完全去codeD和MP3文件将无法播放的问题。下面是我的code：进口重进口OS 进口的urllib2 从BS4进口BeautifulSoup 进口时间高清getHTMLstring（URL）： HTML = urllib2.urlopen（URL ..

发布时间：2016-08-05 19:18:40 python unicode encoding web-scraping beautifulsoup Python

BeautifulSoup在Python不正确的解析

我正在运行的Python 2.7.5，并使用内置的HTML解析器什么我即将来形容。我试图完成的任务是，以HTML的一大块是本质上是一个良方。下面是一个例子。 html_chunk =“＆LT; H1＆GT;微型薯Knishes＆LT; / H1＆GT;＆LT; P＆GT;发贴者bettyboop50在recipegoldmine.com 2001＆LT 5月10日; / P＆GT;＆LT; ..

发布时间：2016-08-05 19:18:18 python html encoding beautifulsoup 前端开发

在UTF-8字符编码问题

我通过 a.get使用美丽的汤库（'href“属性）从一个网页的链接。在链接有一个奇怪的字符®但是当我成为Â®。我怎样才能连接code得当？我在页的开头已经添加了＃ - * - 编码：UTF-8 - * - R = requests.get（URL）汤= BeautifulSoup（r.text）解决方案待办事项的不的使用 r.text ;离开解码到 BeautifulSoup ： ..

发布时间：2016-08-05 19:08:53 python encoding utf-8 beautifulsoup python-requests Python

UNI $ C $岑codeError与BeautifulSoup 3.1.0.1和Python 2.5.2

使用BeautifulSoup 3.1.0.1和Python 2.5.2，并试图用法语解析网页。然而，当我打电话的findAll，我得到以下错误：的的Uni $ C $岑codeError：“ASCII”codeC无法连接code字符U'\\ xe9“在1146的位置是：序数不在范围内（128）下面是code我目前运行的：进口的urllib2 从BeautifulSoup进口Beaut ..

发布时间：2016-08-05 19:04:56 python encoding screen-scraping beautifulsoup Python

UNI $ C $岑codeError：“ASCII”codeC不能在特别的名字EN code字

我的Python（版本2.7）脚本运行良好获得本地HTML文件的一些公司的名字，但是当涉及到一些具体的国家名称，它给这个错误“的Uni $ C $岑codeError：”ASCII“ codeC无法连接code字符“ 特别得到错误时，这家公司的名字来自公司名称：KühlfixKälteanlagenIng.Gerhard Doczekal＆安培; Co. KG的的链接，不能被处理 ..

发布时间：2016-08-05 19:02:05 python unicode encoding beautifulsoup ascii Python

BeautifulSoup4 stripped_strings给我字节的对象？

我试图让文本从一个块引用它看起来像这样的：＆LT;块引用类=“postcontent恢复”＆GT; 01 Oyasumi ＆LT; BR＆GT;＆LT; / BR＆GT; 02 DanSin“ ＆LT; BR＆GT;＆LT; / BR＆GT; 03 w.t.s. ＆LT; BR＆GT;＆LT; / BR＆GT; 04 Lovism ..

发布时间：2016-08-05 19:00:30 python python-2.7 unicode encoding beautifulsoup Python

在批处理文件中的文本/ CSV文件转换为UTF-8格式

在这里WMIC命令给被写入到一个临时文件的输出，我编写一个批处理文件 WMIC /节点：%%一个卷获得的系统名称，标题，自由空间，容量＆GT; TEMP.TXT 临时文件生成，但它的编码是的 UCS-2的Little Endian。所以，当我试图使用循环读取文本文件， FOR / F“标记= 1”%%的B（TEMP.TXT）做（回声%%乙）这多年平均值 ..

发布时间：2016-08-04 19:15:33 batch-file encoding utf-8 cmd Windows 2008/2003/2000

我如何使用蝙蝠脚本创建具有变音符号文件/文件夹

我有读取行的文件，然后一个bat文件试图创建文件或文件夹，根据给定的参数。的问题是，当它到达字符作为ăâţîş，这是行不通的。这是我的code： IF“％1”==“”GOTO决赛 IF“％1”==“文件”GOTO文件 IF“％1”==“文件夹”文件夹GOTO：文件 FOR / F %% i的（files.txt）做呼应。＆GT; %% i.rtf GOTO决赛：夹 F ..

发布时间：2016-08-04 19:15:31 batch-file encoding diacritics Windows 2008/2003/2000

PowerShell的 - 批量更改文件编码设置为UTF-8

我试图做一个死简单的事情：从什么改变文件编码为UTF-8无BOM。我发现了几个脚本，做到这一点，只有真正为我工作的一个是这一个： ..

发布时间：2016-08-04 17:36:30 powershell encoding batch-file utf-8 Windows 2008/2003/2000

批处理文件编码

我想处理包含文件名奇怪的字符，如法国é。一切都在外壳做工精细： C：\\ somedir \\＆GT;任-hélice厚蟹知道如果我把这个行.bat文件，我得到以下结果： C：\\ somedir \\＆GT;任-hÚlicehÚlice 看到了吗？ é已取代U 同样是命令的输出如此。如果我 DIR 一些目录中的外壳，输出是好的。如果我这个输出重定向到一个文件中，出现一些字符 ..

发布时间：2016-08-04 16:26:17 windows encoding batch-file cmd Windows 2008/2003/2000

SED和UTF-8编码

在SSH（腻子）我使用一个命令来替换一个文件，该文件是EN $ C $光盘UTF-8 一些文本例如 CD〜/的public_html /应用/配置; SED -i“S / ADDRESS_SSH / L'住址àETE correctementintégréé/ G'param.php; 在文件中的所有正常，但在浏览器中显示时的口音很奇怪当verifing文件param.php我发现 ..

发布时间：2016-08-03 12:14:54 bash encoding utf-8 ssh sed Linux/Unix

Cygwin的终端没有显示某些字符？

我正在运行的股票Cygwin的安装，添加包 wget的。如果我运行一个命令 wget的-qO- tetristv.com/zapni.tv.php 我得到这个;注意字符显示不正确session=OTA5Mjc0ODU5OA==&stream=play #EXTINF:0,▒T 1＆LT; BR＆GT;＆LT; B＆GT;＆LT;一 HREF =“http:// ..

发布时间：2016-08-03 11:50:08 bash encoding cygwin windows-1252 cp1252 Linux/Unix

如何转换递归文件夹中的子树的所有文件名从UTF-8 ASCII在Linux中

我很安静的新bash的脚本，我想所有的递归我从文件名UTF-8编码转换成文件夹为ASCII（这是非常便携编码）。我认为iconv命令将一些使用的：的iconv -f -t UTF8 ASCII ... 但我不知道如何准确地使用它。最好的情况是bash脚本应该打印一些暗示它的进步，如文件只是转换的名字。结果非常感谢你。解决方案查找/我的/路径型的F＆GT; utf8list 的 ..

发布时间：2016-08-03 11:20:17 bash encoding filenames Linux/Unix

无法连接code TIFF文件正确，某些字符不编码

我有一个包含多个图像的TIFF文件，我需要循环通过TIFF文件单独提取图像，我用的base64 EN code，然后用子串单独的图像和使用的base64德code在文件系统写的，但是，只有一些图片都可以提取。例子：我有一个TIFF文件7张图片，但它仅提取4图像。所以我有恩codeD数据写入到文件和读取，我可以只能够看到II * EN code字符作为4位，而不是7 .. 当我使用 ..

发布时间：2016-08-01 21:48:18 java encoding base64 tiff decoding Java开发

RTF文件的编码

我得到一个base64连接codeD字符串，再presents一个RTF文件。如果我看原文重新presentation（带的base64 code）之前我看到字符序列 FR 。这应该代表毛皮，在浏览器中显示时。 RTF格式文件的标题包含 ansicpg1252 因此除另有变化，这应该是编码（转义序列，字体定义，..）。我现在的问题是，我不能正确地去code基64字符串到原来的再presen ..

发布时间：2016-08-01 21:45:14 c# encoding character-encoding base64 rtf C#/.NET

我有一个未加密/ unen codeD字符串 - “565040574”。我也有加密/ EN codeD字符串此字符串 - “BSubW2AUWrSCL7dk9ucoiA ==” 它看起来像这样的字符串加密了之后已经Base64ed，但我不知道是哪个加密算法已被使用。如果我转换“BSubW2AUWrSCL7dk9ucoiA ==”字符串使用 Convert.FromBase64String（“B ..

发布时间：2016-08-01 21:45:11 c# encryption encoding base64 C#/.NET

RFC 4648（基本[16,32,64]）在Matlab中的实现

有 RFC4648 的任何实现（以下简称“Base16，Base32和Base64数据编码” ）在Matlab？解决方案在MATLAB，你可以很容易地使用嵌入式的 Java功能的。 MATLAB附带 Apache的共享codeC 库中可用的Java类路径。所以，你可以这样做：海峡='http://stackoverflow.com/q/11659710/'; 。EN codeR = ..

发布时间：2016-08-01 21:44:19 matlab encoding base64 其他开发

如何连接code文本在Python采用base64

我想带code文本字符串为base64。我试着这样做： NAME =“你的名字” 打印（“编码为Base64收益率％s =％S \\ n'％（姓名，name.en code（'的base64'，'严'）））但是，这给了我以下错误： LookupError：'的base64'不是文本编码;使用codecs.en code（）来处理任意codeCS 我如何去这样做？（使用Pytho ..

发布时间：2016-08-01 21:44:07 python python-3.x encoding base64 Python

什么是对的网址安全和文件名安全base64的最佳人选填充字符？

有关官方的base64的填充字符是'='，这可能需要在URL中使用时，必须％的恩codeD。我试图找到最好的填充字符，使我的恩codeD字符串既可以是URL安全的（我将使用EN codeD字符串作为参数值，比如ID = EN codedString ）和文件名安全（我会直接使用EN codeD字符串作为文件名）。点（“。”）是一个热门人选，它的网址安全的，但它不是完全安全的文件名：的 Wind ..

发布时间：2016-08-01 21:43:31 encoding base64 padding 其他开发

encoding相关内容