python - 抓取下的unicode编码转urlcode
本文介绍了python - 抓取下的unicode编码转urlcode的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
问 题
articles=response.css("#content > article:nth-child(5) p")
sgg="";
for item in articles:
sgg = sgg+item.extract()
data=urllib.urlencode({ 'title':title ,"describle":describle,"article":sgg} );
我想把sgg+item.extract() 转换为字符串.转换为urlcode.发送出去.
不过我碰到问题是这个
articles=response.css("#content > article:nth-child(5) p")
for item in articles: print ( type(item.extract()) )
输出
<type 'unicode'>
所以如果
data = {
'title': title,
'describle': describle,
'article': article
}
print urllib.urlencode(data);
就报错了
解决方案
不知道你说的高效是啥,贴上可读性好一点的代码
articles = response.css("#content > article:nth-child(5) p")
article = ''.join([_.extract() for _ in articles])
data = {
'title': title,
'describle': describle,
'article': article
}
print urllib.urlencode(data);
你再结比一下这段代码
import urllib
data = {
'title': '标题',
'describle': 'abc',
'article': u'中文'.encode('utf-8')
}
print urllib.urlencode(data);
这篇关于python - 抓取下的unicode编码转urlcode的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文