jsoup - 概述

jsoup是一个基于Java的库,用于处理基于HTML的内容.它提供了一个非常方便的API来提取和操作数据,使用最好的DOM,CSS和类似jquery的方法.它实现了WHATWG HTML5规范,并将HTML解析为与现代浏览器相同的DOM.

jsoup libary实现了WHATWG HTML5规范,并将HTML内容解析为相同的DOM.现代浏览器.

jsonp库提供以下功能.

  • 多个阅读支持 : 它使用URL,文件或字符串读取和解析HTML.

  • CSS选择器 : 它可以使用DOM遍历或CSS选择器查找和提取数据.

  • DOM操作 : 它可以操纵HTML元素,属性和文本.

  • 防止XSS攻击 : 它可以根据给定的安全白名单清除用户提交的内容,以防止XSS攻击.

  • 整洁 : 它输出整洁的HTML.

  • 处理无效数据 :  jsoup可以处理未关闭的标签,隐式标签,并且可以可靠地创建文档结构.