html-parsing相关内容

使用Java从HTML提取锚标记

我在文本中有几个锚标记 输入:Take me to StackOverflow 输出: http://stackoverflow.com 如何在不使用第三方API的情况下找到所有这些输入字符串并将其转换为Java中的输出字符串? 解决方案 public static void main(Str ..
发布时间:2020-11-24 21:14:37 Java开发

如何从其HTML代码打印表中存在的空数据?

我正在使用python中存在的HTMLParser模块通过通过HTMLParser解析HTML页面来在表中打印数据.我无法在表格中打印空白字段. 这是我正在使用的代码: class MyParser(HTMLParser): def __init__(self, data ): HTMLParser.__init__(self) self.fee ..
发布时间:2020-11-24 21:14:36 Python

用约束将字符串分割成较小的部分[PHP RegEx HTML]

我需要将长字符串分割成具有以下约束的数组: 输入将是HTML字符串,可以是整页或部分页面. 每个部分(新字符串)的字符数都是有限的(例如,不超过8000个字符) 每个部分可以包含多个句子(以.[句号分隔).但不能包含部分句子. 除非字符串的最后一部分(因为最后一部分可能没有句号. 该字符串包含HTML标记.但是标记不能被划分为(至 ..
发布时间:2020-11-24 21:13:14 PHP

如何从PHP的HTML表中提取数据?

可能重复: 如何使用PHP解析和处理HTML? 假设我要从此处的表格中提取某个数字/文本:我想在 FIFA排名位置下的右表td中获得第一个数字.现在应该是 88 .经检查,为88 . 我将如何使用PHP从所述网页中提取信息? 编辑:我被告知JQuery/JavaScript就是为了这个……更适合 解决方案 这可能更漂亮,但它的内容类似 ..
发布时间:2020-11-24 21:09:31 PHP

访问安全Web服务器上的文档

我正在尝试构建一个iPad应用程序,以从Web服务器下载和显示文档(pdf,ppt,doc等). 当前,它是通过解析服务器上的HTML结构(使用hpple)来实现的. 例如,文件保存在: Http://myserver.com/myFolders/myFiles/ 应用程序使用X-Path查询(例如, "/html/body/ul/li/a" 然后将找到的所有文档下载到i ..
发布时间:2020-11-24 21:09:27 移动开发

如何使用Perl解析HTML?

我也是编程和学习Perl的新手. 这是我的问题:如何使用Perl模块在Perl中解析下面的数据? This is the line abc : 130.65 TB dif : 74.52 TB asw : 56.13 TB qwe : 57 这是来自网页的示例数据,我想要类似的输出 abc = 130.65 TB dif = ..
发布时间:2020-11-24 21:09:13 其他开发

读与写解析HTML到列表

我一直在尝试阅读&解析一些HTML以获得动物收容所中动物的条件列表.我确定我对HTML解析的经验不足无济于事,但我似乎并没有很快获得进展. 这是HTML的摘要: Behavi ..
发布时间:2020-11-24 21:09:09 其他开发