以下示例将展示可以提供html页面中存在的相对和绝对URL的方法.
String url = "http://www.IT屋.com/"; Document document = Jsoup.connect(url).get(); Element link = document.select("a").first(); System.out.println("Relative Link: " + link.attr("href")); System.out.println("Absolute Link: " + link.attr("abs:href")); System.out.println("Absolute Link: " + link.absUrl("href"));
其中
文件 : document对象代表HTML DOM.
Jsoup : 连接到网址并获取html内容的主要类.
link : Element对象表示代表锚标记的html节点元素.
link.attr("href") : 提供锚标记中存在的href值.它可能是相对的或绝对的.
link.attr("abs:href") : 在解析文档的基URI后提供绝对URL.
link.absUrl("href") : 在解析文档的基URI后提供绝对URL.
元素对象代表dom elment并提供获取html页面中存在的相对URL和绝对URL的方法.
使用任何一个创建以下java程序你选择的编辑说C:/> jsoup.
JsoupTester.java
import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; public class JsoupTester { public static void main(String[] args) throws IOException { String url = "http://www.IT屋.com/"; Document document = Jsoup.connect(url).get(); Element link = document.select("a").first(); System.out.println("Relative Link: " + link.attr("href")); System.out.println("Absolute Link: " + link.attr("abs:href")); System.out.println("Absolute Link: " + link.absUrl("href")); } }
使用 javac编译类编译如下:
C:\jsoup>javac JsoupTester.java
现在运行JsoupTester查看结果.
C:\jsoup>java JsoupTester
查看结果.
Relative Link: index.htm Absolute Link: https://www.it1352.com/index.htm Absolute Link: https://www.it1352.com/index.htm