python - 抓取下的unicode编码转urlcode

查看:217
本文介绍了python - 抓取下的unicode编码转urlcode的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

    articles=response.css("#content > article:nth-child(5) p")
    sgg="";
    for item in articles:
        sgg = sgg+item.extract()
    data=urllib.urlencode({ 'title':title ,"describle":describle,"article":sgg} );

我想把sgg+item.extract() 转换为字符串.转换为urlcode.发送出去.

不过我碰到问题是这个

articles=response.css("#content > article:nth-child(5) p")

    for item in articles:  print (  type(item.extract()) )

输出
<type 'unicode'>

所以如果

data = {

'title': title,
'describle': describle,
'article': article

}

print urllib.urlencode(data);

就报错了

解决方案

不知道你说的高效是啥,贴上可读性好一点的代码

articles = response.css("#content > article:nth-child(5) p")

article = ''.join([_.extract() for _ in articles])
data = {
    'title': title,
    'describle': describle,
    'article': article
}

print urllib.urlencode(data);

你再结比一下这段代码

import urllib

data = {
    'title': '标题',
    'describle': 'abc',
    'article': u'中文'.encode('utf-8')
}

print urllib.urlencode(data);

这篇关于python - 抓取下的unicode编码转urlcode的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆