python - scrapy xpath 页面解析找不到

查看：131 发布时间：2017/9/5 22:47:59 xpath python

本文介绍了python - scrapy xpath 页面解析找不到的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

问题

下面是页面大类的html

<div id="a144e40e-56c4-4984-b404-1a0230194b42" class="house-item clearfix house-item-curr">
                <p class="item-photo fl">
                    <a href="/zufang/shbs12427828.html" target="_blank">
                        <img class="lazy" data-original="//imgsh.centanet.com/ctpostimage/a4/d5/4e4da3a2496299b2b26243565af6_220x165.jpg" src="//imgsh.centanet.com/ctpostimage/a4/d5/4e4da3a2496299b2b26243565af6_220x165.jpg" alt="采菊苑租房2800元/月" title="采菊苑租房2800元/月" style="display: inline-block;"></a>
                </p>
                <div class="item-info fl">
                    <h4 class="house-title">
                        <a href="/zufang/shbs12427828.html" title="采菊苑，77平两房出租，毛坯3千，好谈价！" target="_blank" class="cBlueB">采菊苑，77平两房出租，毛坯3千，好谈价！</a>
                    </h4>
                    <p class="f14 f000 mb_10">
                        <a href="/xiaoqu/xq-pedpwawows/" class="f000 mr_10" target="_blank" title="采菊苑二手房">采菊苑</a><span class="f000 mr_10">2室2厅</span><span class="f000">77平</span>
                    </p>
                    <p class="f7b mb_10">
                        南北<em class="mrl_6">|</em>高层<em class="mrl_6">|</em>毛坯<em class="mrl_6">|</em>2008年<em class="mrl_6">|</em>整租
                    </p>
                    <p class="f7b mb_15">
                        宝山-顾村 菊联路68弄
                        <a style="cursor: pointer" href="javascript:void(0)" value="/page/v1/common/maputil.aspx?x=121.372168&amp;y=31.354713" class=" icons_map jsmapicon  "></a>
                        
                    </p>                    
                </div>
                 <div class="item-pricearea fr">
                    <p class="price-nub cRed">2800元/月</p>
                     <p class="f14 f000 mb_15 fsm">&nbsp;</p> 
                </div>
                <div class="clear"></div>
            </div>

我用xpath提取text 我的代码是

class itcast(scrapy.Spider):
    name = 'SH'
    allowd_domains = ["http://sh.centanet.com/"]
    start_urls = ["http://sh.centanet.com/zufang/p2/"]

    def parse(self,response):
        
        list = response.xpath("//div[@class='//div[@class='ouse-item clearfix house-item-curr']")
        
        for i in list:
            name = i.xpath("//a[@class='cBlueB'.text()]")
            print name[0]

我可以找到这个大类
报错是在 for i in list：
name =f.xpath()这行，text提取不到。
执行代码找不到，帮我看看我是哪里不对，类似的我也试过好多次，没办法了，只能提问了希望能回答下谢谢！

解决方案

應該是

name = i.xpath("//a[@class='cBlueB']/text()")

常用表达式实例

/ Document Root文档根.
/* 选择文档根下面的所有元素节点，即根节点（XML文档只有一个根节点）
/node() 根元素下所有的节点（包括文本节点，注释节点等）
/text() 查找文档根节点下的所有文本节点

这篇关于python - scrapy xpath 页面解析找不到的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

python - scrapy xpath 页面解析找不到

问题描述

相关文章

Python最新文章

热门教程

热门工具

登录关闭

python - scrapy xpath 页面解析找不到

问题描述

相关文章

Python最新文章

热门教程

热门工具

登录 关闭

登录关闭