首页
Java开发
使用jSoup解析内部html标签

使用jSoup解析内部html标签 [英] Parse the inner html tags using jSoup

查看：108 发布时间：2018/6/26 10:17:56 java html jsoup

本文介绍了使用jSoup解析内部html标签的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我想在使用Jsoup库的网站中找到重要的链接。因此，假设我们有以下代码：

I want to find the important links in a site using Jsoup library. So for this suppose we have following code:

<h1><a href="http://example.com">This is important </a></h1>

现在解析我们如何发现标签a位于h1标签内？

Now while parsing how can we find that the tag a is inside the h1 tag?

推荐答案

您可以这样做：

You can do it this way:

File input = new File("/tmp/input.html"); Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/"); Elements headlinesCat1 = doc.getElementsByTag("h1"); for (Element headline : headlinesCat1) { Elements importantLinks = headline.getElementsByTag("a"); for (Element link : importantLinks) { String linkHref = link.attr("href"); String linkText = link.text(); System.out.println(linkHref); } }

取自 JSoup Cookbook 。

这篇关于使用jSoup解析内部html标签的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

相关文章

JSoup - 通过标签解析HTML标签;

使用Jsoup保留内部html时，HTML解析和除去锚标记;

JSoup解析HTML;

使用Jsoup解析Html内容;

Jsoup解析带有tbody标签的HTML文件;

如何使用jsoup解析HTML表格？;

使用Jsoup解析HTML时出错;

使用jsoup从HTML解析表格;

如何使用Jsoup解析HTML文本?;

Html与JSoup解析;

如何使用jsoup解析lu，li标签?;

Jsoup解析和嵌套标签;

使用jsoup解析XML——防止jsoup“清理"<链接>标签;

如何避免在Jsoup解析中的HTML头标签;

如何使用jsoup从HTML解析表;

使用Jsoup提取和解析HTML表;

如何使用Jsoup计算HTML标签总数;

Jsoup解析HTML的问题;

用Jsoup解析表格html;

问题与jsoup解析HTML;

Jsoup仅删除html标签;

使用jsoup解析XML - 防止jsoup“清理” &LT; LINK&GT;标签;

JSoup解析标签内的数据;

无法使用Jsoup解析网址的完整html;

使用Android的Jsoup解析HTML的麻烦;

Java开发最新文章

Tomcat 404错误：原始服务器没有找到目标资源的当前表示，或者不愿意透露该目录的存在;

由于缺少ServletWebServerFactory bean，无法启动ServletWebServerApplicationContext;

无法反序列化的java.util.ArrayList实例出来VALUE_STRING的;

什么是AssertionError？在这种情况下，我应该从我自己的代码中抛出？;

JSON反序列化投掷例外 - 无法反序列化的java.util.ArrayList实例出来START_OBJECT令牌;

Maven构建错误 - 无法执行目标org.apache.maven.plugins：Maven的组装插件：2.5.5;

正确使用Optional.ifPresent（）;

获取异常（org.apache.poi.openxml4j.exception - 没有内容类型[M1.13]）阅读使用Apache POI XLSX文件时？;

SpringBoot - 制作jar文件 - 在META-INF / spring.factories中找不到自动配置类;

HTTP状态404 - 请求的资源（/）不可用;

热门教程

Java教程

Apache ANT 教程

Kali Linux教程

JavaScript教程

JavaFx教程

MFC 教程

Apache HTTP客户端教程

Microsoft Visio 教程

热门工具

Java 在线工具

C(GCC) 在线工具

PHP 在线工具

C# 在线工具

Python 在线工具

MySQL 在线工具

VB.NET 在线工具

Lua 在线工具

Oracle 在线工具

C++(GCC) 在线工具

Go 在线工具

Fortran 在线工具

登录关闭

扫码关注1秒登录

发送“验证码”获取 | 15天全站免登陆

友情链接： IT屋 Chrome插件谷歌浏览器插件

IT屋 ©2016-2022 琼ICP备2021000895号-1 站点地图站点标签 SiteMap <免责申明> 本站内容来源互联网,如果侵犯您的权益请联系我们删除.