jsoup相关内容

使用Jsoup从特定类获取所有href值

我试图解析我的大学网站,以从主站点获取新闻列表(标题+链接).但是,当我尝试解析一个完整的网站时,我正在寻找的链接嵌套在其他类,表等的深处.这是我尝试使用的代码: String url = "http://www.portal.pwr.wroc.pl/index,241.dhtml"; Document doc = Jsoup.connect(url).get(); Elem ..
发布时间:2020-11-24 04:49:11 Java开发

使用jsoup从网站网址中提取YouTube视频网址

我在同一网站上使用了此代码,但是他们改变了主题,现在我很挣扎. 在这里我要怎么做才能获取youtube视频的网址?这是我的方法.该站点的示例链接为 http://kabumbu.co.tz/mahojiano-na -masau-bwire/ Element video = doc.select("div.single-archive iframe").first() ; ..
发布时间:2020-08-30 06:32:59 移动开发

如何在WebView Android上显示网页的一部分

我正在尝试从网页中提取一小部分并加载到webview中 我已经尝试按照链接中给出的解决方案进行操作,但这没有用 显示部分webview android上的网页 使用getElementsByClass("darewod")提取数据 htmlDocument = Jsoup.connect(htmlPageUrl).get(); element = htmlDocument.get ..
发布时间:2020-08-30 03:10:37 Java开发

如何向Jsoup添加代理支持?

我是Java的初学者,我的第一个任务是解析大约10,000个URL并从中提取一些信息,为此,我正在使用 Jsoup ,并且工作正常. 但是现在我想为其添加代理支持.代理也有用户名和密码. 解决方案 您不必通过Jsoup获取网页数据.这是我的解决方案,虽然可能不是最好的. URL url = new URL("http://www.example.com/"); Prox ..
发布时间:2020-06-26 20:58:19 Java开发

JSoup字符编码问题

我正在使用JSoup解析 http://www.latijnengrieks.com/中的内容vertaling.php?id = 5368 .这是第三方网站,未指定正确的编码.我正在使用以下代码加载数据: public class Loader { public static void main(String[] args){ String url = "http ..
发布时间:2020-06-26 20:53:37 Java开发

如何将jsoup文档另存为文本文件

我正在尝试将网页上的所有可读单词保存到一个文本文档中,而忽略html标记. 使用JSoup解析网页上的所有单词,我唯一的猜测是如何通过代码元素将真实单词与代码分开. 是否可以将jsoup文档的多个元素转换为文本文件? 即: Elements titles = doc.select("title"); Elements paragraphs = do ..
发布时间:2020-06-12 19:03:23 Java开发

使用JSoup发布方法登录网站

我正在尝试使用JSoup post方法登录网站.我看到了一些例子,但都没有用. 我正在尝试登录: http://ug.technion.ac.il/Tadpis.html 为此,我有以下代码: String url = "http://ug.technion.ac.il/Tadpis.html"; doc = Jsoup.connect(url).data("userid", "my_u ..
发布时间:2020-05-29 18:52:05 前端开发

Selenium jSoup从Javascript网页获取数据

最近已经问了几个问题,但是还没有真正找到我想要的东西. 我正在尝试从 http://www获得所有匹配项.futbol24.com/Live/?__ igp = 1& LiveDate = 20141106 打印出来,包括时间,主队和客队.我了解页面加载后会加载内容. 有人告诉我要使用Selenium,然后对结果使用jSoup来获取所需的数据.是否有人可以在上面的网站上给我看一些教程或 ..
发布时间:2020-04-24 10:08:39 Java开发

在jsoup中解析之前如何暂停?

我需要在解析之前暂停我的脚本(我想等待一些信息),但是如何在Jsoup中做到这一点? 我尝试过: link = Jsoup.connect("link").wait(100).get(); 但这对我不起作用. 解决方案 通常,通过AJAX加载内容时需要等待. Jsoup无法处理此类问题,因为它不是浏览器. Jsoup只是解释HTML.连接的内容或多或少只是Java连接的包装 ..
发布时间:2020-04-24 10:08:02 Java开发

Jsoup返回状态400

我要从以下URL抓取数据: 所以我写了以下代码 import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import static org.jsoup.Connection.*; /** * Created by avi on 11/24/17. */ public ..
发布时间:2020-04-24 10:07:59 Java开发

Android:将外部库添加到项目中无法正常工作

我正在尝试将Jsoup库添加到我的项目中,但是程序中出现错误提示“无法解析符号'Jsoup'".以下是我已经完成的工作,但是没有正常工作. 1)我从Jsoup网站下载了核心库jsoup-1.10.2.jar 2)将.jar文件拖放到我的项目的libs文件夹下 3)在build.gradle中的依赖项下,我添加了以下行 compile files('libs/jsoup-1.10.2 ..
发布时间:2020-04-24 10:07:57 Java开发

URL中存在分页时如何导航到其他页面

我有一个URL( http://myURL.com ),我从该URL中读取内容网页.问题是我只能阅读page1的内容.给定分页页面的page2 URL时,在使用page2内容读取page2内容时仍使用jsoup API,但它在打印时显示的是page1的内容,而不是显示page2的内容,但是在浏览器中打开page2 URL时,它显示的是内容Web浏览器中page2的大小.关于出现分页时如何阅读其他页 ..
发布时间:2020-04-24 10:07:54 Java开发

删除所有HTML标记

我有一个字符串,其中包含完整的XML get请求. 在请求中,有很多HTML和一些我想删除的自定义命令. 我知道的唯一方法是使用 jSoup . 例如像这样. 现在,由于请求来自的网站还具有自定义命令,因此我无法完全删除所有代码. 例如,这是我要' clean '的字符串: \u0027s normal text here\u003c/b\u003e http: ..
发布时间:2020-04-24 10:07:50 Java开发