首页
前端开发
xpath无法识别标签

xpath无法识别标签 [英] xpath could not recognize a tag

查看：326 发布时间：2018/6/19 15:38:14 javascript html xpath web-scraping scrapy

本文介绍了xpath无法识别标签的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我正在尝试使用xpath从论坛中删除reddit帖子。
我希望蜘蛛实现的功能之一就是当它从当前页面结束时自动进入下一页。
页面html代码如下所示：

< span>

我使用了xpath选择器： response.xpath（// a [@class ='next-button']）但它没有给我一切都回来了有人可以帮我弄清楚为什么吗？

 
 
 谢谢！ 
 Hao  
 
解决方案   @class   span 元素，而不是 a 链接元素。因此，将您的XPath更改为
  response.xpath（// span [@class ='next-button'] / a ）
  
选择 a 或
  response.xpath（// span [@class ='next-button'] / a / @ href）
  
可以获取链接地址。
 
I am trying to use xpath to scrape reddit posts from a forum. 
One of the functions I want the spider to achieve is to automatically go to the next page as soon as it finishes scrapping from the current page. 
The page html code looks like this:



<span class="next-button"><a href="https://www.reddit.com/r/InteriorDesign/?count=975&amp;after=t3_8ol7yp" rel="nofollow next" >next &rsaquo;</a></span>





and I used the xpath selector as:
      response.xpath("//a[@class = 'next-button']")
but it didn't give me anything back. Can someone help me figure out why?

thanks!
Hao
 解决方案 
The @class attribute is on the span element and not the a link element. So change your XPath to
response.xpath("//span[@class = 'next-button']/a")
to select a or
response.xpath("//span[@class = 'next-button']/a/@href")
to get the link address.

                        这篇关于xpath无法识别标签的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！
                        
                    
                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            无法识别PrimeFaces标签;
                        
                    
                    
                        
                            在 xslt 中无法识别 XPath 和 min 函数;
                        
                    
                    
                        
                            PyWinAuto - Xpath 之类的识别;
                        
                    
                    
                        
                            Netbeans 7.4 无法识别 PHP 短标签;
                        
                    
                    
                        
                            Netbeans 7.4无法识别PHP短标签;
                        
                    
                    
                        
                            Xpath 选择多个标签;
                        
                    
                    
                        
                            XPath 选择多个标签;
                        
                    
                    
                        
                            intellisense无法识别PUBXML中的正确标签;
                        
                    
                    
                        
                            PrimeFaces p:ajax无法识别Facelet标签参数;
                        
                    
                    
                        
                            Powershell:当元素具有“xmlns"时，XPath 无法选择标签?;
                        
                    
                    
                        
                            Xpath nodeValue / textContent无法看到&lt; BR&gt;标签;
                        
                    
                    
                        
                            CDATA 中标签的 Xpath;
                        
                    
                    
                        
                            为 svg 标签创建 XPATH;
                        
                    
                    
                        
                            为svg标签创建XPATH;
                        
                    
                    
                        
                            获取 XML 标签的 XPath;
                        
                    
                    
                        
                            XPath / XSLT删除空标签;
                        
                    
                    
                        
                            空 P 标签之间无法识别的字符 TinyMCE;
                        
                    
                    
                        
                            新的人居项目-无法识别的Sitecore标签;
                        
                    
                    
                        
                            Unnest (xpath()) 不能正确识别 NULL 值;
                        
                    
                    
                        
                            无法遍历Xpath;
                        
                    
                    
                        
                            Internet Explorer 无法识别“html"css 背景图像标签?;
                        
                    
                    
                        
                            我如何识别标签？;
                        
                    
                    
                        
                            识别NFC标签ID;
                        
                    
                    
                        
                            XPath解析“SRC”来自IMG标签？;
                        
                    
                    
                        
                            div标签中数据的Xpath;


    
        
            前端开发最新文章
            
                    
                        
                            为什么Chrome（在Electron内部）突然重定向到chrome-error：// chromewebdata？;
                        
                    
                    
                        
                            错误102（net :: ERR_CONNECTION_REFUSED）：服务器拒绝连接;
                        
                    
                    
                        
                            如何解决'重定向已被CORS策略阻止：没有'Access-Control-Allow-Origin'标题'？;
                        
                    
                    
                        
                            如何处理“Uncaught（in promise）DOMException：play（）失败，因为用户没有首先与文档交互。”在桌面上使用Chrome 66？;
                        
                    
                    
                        
                            警告：添加非被动事件侦听器到滚动阻塞'touchstart'事件;
                        
                    
                    
                        
                            如何在浏览器中播放.TS文件（视频/ MP2T媒体类型）？;
                        
                    
                    
                        
                            此请求已被阻止;内容必须通过HTTPS提供;
                        
                    
                    
                        
                            资源解释为样式表，但转换为MIME类型text / html（似乎与web服务器无关）;
                        
                    
                    
                        
                            通过HTTPS加载页面但请求不安全的XMLHttpRequest端点;
                        
                    
                    
                        
                            拒绝从执行脚本'*'，因为它的MIME类型（“应用/ JSON'）不是可执行文件，并严格MIME类型检查被启用。;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.