python - Scrapy的这个demo正则表达式该怎么写?
本文介绍了python - Scrapy的这个demo正则表达式该怎么写?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
问 题
HTML:
<html>
<head>
<base href='http://example.com/' />
<title>Example website</title>
</head>
<body>
<div id='demo'>
<div>水果:苹果 运动:足球 语言:中文</div>
</div>
</body>
</html>
我想得到这样的结果:
>>> response.xpath('//div[@id="demo"]/div/text()').re(r'')
u'苹果'
>>> response.xpath('//div[@id="demo"]/div/text()').re(r'')
u'足球'
>>> response.xpath('//div[@id="demo"]/div/text()').re(r'')
u'中文'
问题:
上面re(r'')
中的正则表达式该怎么写?
解决方案
import re
a = u'水果:苹果 运动:足球 语言:中文'
print re.findall(u'[\u4E00-\u9FA5]+?:([\u4E00-\u9FA5]+)', a)
这篇关于python - Scrapy的这个demo正则表达式该怎么写?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文