以下示例将展示将HTML字符串解析为Document对象.
Document document = Jsoup.parse(html);
其中
文件 : document对象代表HTML DOM.
Jsoup : 用于解析给定HTML字符串的主类.
html : HTML字符串.
parse(String html)方法将输入HTML解析为一份新文件.此文档对象可用于遍历和获取html dom的详细信息.
使用您选择的任何编辑器创建以下Java程序比方说C:/> jsoup.
JsoupTester.java
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class JsoupTester { public static void main(String[] args) { String html = "<html><head><title>Sample Title</title></head>" + "<body><p>Sample Content</p></body></html>"; Document document = Jsoup.parse(html); System.out.println(document.title()); Elements paragraphs = document.getElementsByTag("p"); for (Element paragraph : paragraphs) { System.out.println(paragraph.text()); } } }
编译班级使用 javac 编译器如下:
C:\ _jsoup> javac JsoupTester.java
现在运行JsoupTester来查看结果.
C:\ jsoup> java JsoupTester
查看结果.
Sample Title Sample Content