首页
其他开发
用于识别未标记文本的 XPath 查询

用于识别未标记文本的 XPath 查询 [英] XPath query to identify untagged text

查看：28 发布时间：2021/10/2 19:32:46 xpath

本文介绍了用于识别未标记文本的 XPath 查询的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

考虑这个 HTML:

<html>
  <head>
  </head>
<body>
  <table>
    <tr>
      <td>
        <h1>title</h1>
        <h3>item 1</h3>
          text details for item 1
        <h3>item 2</h3>
          text details for item 2
        <h3>item 3</h3>
          text details for item 3
      </td>
    </tr>
  </table>
</body>
</html>

我对 XPath 不是很熟悉，但在我看来，没有可以单独匹配文本详细信息"部分的符号.你能确认吗?

I'm not terribly familiar with XPath, but it seems to me that there is no notation which will match the "text details" sections individually. Can you confirm?

推荐答案

使用:

/html/body/table/tr/td/h3/following-sibling::text()[1]

这意味着:获取作为每个table<的子元素的每个tr元素的子元素的每个h3元素的第一个兄弟文本节点/code> 元素是每个 body 元素的子元素，该元素是 html 顶部元素的子元素.


This means: Get the first following sibling text node of every h3 element that is a child of every tr element that is a child of every table element that is a child of every body element that is a child of the html top element.
或者，如果您只知道想要的文本节点是文档中所有 h3 元素 的紧随其后的兄弟节点，那么 XPath 表达式会选择它们:
//h3/following-sibling::text()[1]


                        这篇关于用于识别未标记文本的 XPath 查询的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            Python XPath查询未返回文本值;
                        
                    
                    
                        
                            用于复杂 html 的 hpple XPath 查询;
                        
                    
                    
                        
                            使用 XPath 提取标签之间的文本，包括标记;
                        
                    
                    
                        
                            XPath查询，HtmlAgilityPack和提取文本;
                        
                    
                    
                        
                            德尔福组件用于面部识别和标记;
                        
                    
                    
                        
                            如何使用XPath包含（）用于特定文本？;
                        
                    
                    
                        
                            如何通过 XPath 检索 CDATA 标记中的元素文本?;
                        
                    
                    
                        
                            使用beautifulsoup访问未标记的文本;
                        
                    
                    
                        
                            使用jQuery选择未标记的文本;
                        
                    
                    
                        
                            xpath 查询到 xpath 查询结果;
                        
                    
                    
                        
                            PyWinAuto - Xpath 之类的识别;
                        
                    
                    
                        
                            xpath无法识别标签;
                        
                    
                    
                        
                            如何将 XPath contains() 用于特定文本?;
                        
                    
                    
                        
                            字段'___recordID'未标记为可查询;
                        
                    
                    
                        
                            更正XPath查询以提取div内部文本;
                        
                    
                    
                        
                            用于检查调试 XPath 查询的工具/实用程序;
                        
                    
                    
                        
                            xPath查询;
                        
                    
                    
                        
                            用于文本识别的图像预处理;
                        
                    
                    
                        
                            用于 Scrapy 的 XPATH;
                        
                    
                    
                        
                            如何从 &lt;Strong&gt; 获取文本使用 xpath 标记?;
                        
                    
                    
                        
                            Xpath 查询的输出;
                        
                    
                    
                        
                            如何使用硒和摩卡获取xPath()选择的锚标记的文本;
                        
                    
                    
                        
                            什么是用于查找此内容的多分支 xpath 查询?;
                        
                    
                    
                        
                            Xpath 选择节点直到标记;
                        
                    
                    
                        
                            用于从链接中选择文本的 xpath 表达式;


    
        
            其他开发最新文章
            
                    
                        
                            拒绝显示一个框架，因为它将'X-Frame-Options'设置为'sameorigin';
                        
                    
                    
                        
                            什么是＆QUOT; AW＆QUOT;在部分标志属性是什么意思？;
                        
                    
                    
                        
                            在运行npm install命令时获取'npm WARN弃用'警告;
                        
                    
                    
                        
                            cmake无法找到openssl;
                        
                    
                    
                        
                            从Spark的scala中的* .tar.gz压缩文件中读取HDF5文件;
                        
                    
                    
                        
                            Twitter :: Error :: Forbidden  - 无法验证您的凭据;
                        
                    
                    
                        
                            我什么时候需要一个fb：app_id或者fb：admins？;
                        
                    
                    
                        
                            将.db文件导入R;
                        
                    
                    
                        
                            npm通知创建一个lockfile作为package-lock.json。你应该提交这个文件;
                        
                    
                    
                        
                            拒绝执行内联脚本，因为它违反了以下内容安全策略指令：“script-src'self'”;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.