jsoup 第7页 - IT屋-程序员软件开发技术分享社区

使用Jsoup从特定类获取所有href值

我试图解析我的大学网站，以从主站点获取新闻列表(标题+链接).但是，当我尝试解析一个完整的网站时，我正在寻找的链接嵌套在其他类，表等的深处.这是我尝试使用的代码: String url = "http://www.portal.pwr.wroc.pl/index,241.dhtml"; Document doc = Jsoup.connect(url).get(); Elem ..

发布时间：2020-11-24 04:49:11 java html parsing jsoup Java开发

OpenHTMLToPDF:将自定义字体嵌入到由HTML创建的PDF中

我使用Jsoup和 OpenHTMLToPDF 从HTML创建PDF.我必须在PDF中使用其他字体来覆盖非拉丁字形(请参见简化程序再现了该问题: src/main/resources/test.html Font Test ..

发布时间：2020-11-09 19:54:41 java fonts jsoup pdfbox openhtmltopdf Java开发

使用FileOutputStream时访问被拒绝

我在使它工作时遇到问题.它接收一个字符串，其中包含几条信息. 但是，当我尝试将String写入文件以跟踪程序随时间的变化时，我收到拒绝访问错误: void writeToFile(String input) throws Exception{ File file = new File("C:\\WeatherExports\\export.txt"); ..

发布时间：2020-11-06 02:36:24 java jsoup filenotfoundexception access-denied bufferedwriter Java开发

使用jsoup从网站网址中提取YouTube视频网址

我在同一网站上使用了此代码，但是他们改变了主题，现在我很挣扎. 在这里我要怎么做才能获取youtube视频的网址?这是我的方法.该站点的示例链接为 http://kabumbu.co.tz/mahojiano-na -masau-bwire/ Element video = doc.select("div.single-archive iframe").first() ; ..

发布时间：2020-08-30 06:32:59 android youtube jsoup 移动开发

如何在WebView Android上显示网页的一部分

我正在尝试从网页中提取一小部分并加载到webview中我已经尝试按照链接中给出的解决方案进行操作，但这没有用显示部分webview android上的网页使用getElementsByClass("darewod")提取数据 htmlDocument = Jsoup.connect(htmlPageUrl).get(); element = htmlDocument.get ..

发布时间：2020-08-30 03:10:37 java android webview jsoup Java开发

如何将Jsoup文档转换为W3C文档?

我已经通过解析内部HTML页面来构建Jsoup文档， public Document newDocument(String path) throws IOException { Document doc = null; doc = Jsoup.connect(path).timeout(0).get(); return new HtmlDocumen ..

发布时间：2020-07-29 20:04:56 html-parsing jsoup apache-stanbol 其他开发

通过jSoup从Div标签获取属性值

我有一个如下所示的Div标签 5 days 07:14:41 如何获取eventTTL的值?我想显示eventTTL的值，即:)"4583476000". 解决方案 Element ..

发布时间：2020-06-26 23:04:07 java html-parsing jsoup Java开发

如何向Jsoup添加代理支持?

我是Java的初学者，我的第一个任务是解析大约10,000个URL并从中提取一些信息，为此，我正在使用 Jsoup ，并且工作正常. 但是现在我想为其添加代理支持.代理也有用户名和密码. 解决方案您不必通过Jsoup获取网页数据.这是我的解决方案，虽然可能不是最好的. URL url = new URL("http://www.example.com/"); Prox ..

发布时间：2020-06-26 20:58:19 java jsoup Java开发

JSoup字符编码问题

我正在使用JSoup解析 http://www.latijnengrieks.com/中的内容vertaling.php?id = 5368 .这是第三方网站，未指定正确的编码.我正在使用以下代码加载数据: public class Loader { public static void main(String[] args){ String url = "http ..

发布时间：2020-06-26 20:53:37 java jsoup Java开发

如何将jsoup文档另存为文本文件

我正在尝试将网页上的所有可读单词保存到一个文本文档中，而忽略html标记. 使用JSoup解析网页上的所有单词，我唯一的猜测是如何通过代码元素将真实单词与代码分开. 是否可以将jsoup文档的多个元素转换为文本文件? 即: Elements titles = doc.select("title"); Elements paragraphs = do ..

发布时间：2020-06-12 19:03:23 java text jsoup document Java开发

使用JSoup发布方法登录网站

我正在尝试使用JSoup post方法登录网站.我看到了一些例子，但都没有用. 我正在尝试登录: http://ug.technion.ac.il/Tadpis.html 为此，我有以下代码: String url = "http://ug.technion.ac.il/Tadpis.html"; doc = Jsoup.connect(url).data("userid", "my_u ..

发布时间：2020-05-29 18:52:05 html post jsoup 前端开发

使用Jsoup检测脚本中的文本并获取脚本标签中的文本

我想编码以获取价值流，但失败了. 网址检测 http://m.xemtvhd.com/vtv1.php 如何获取价值流: html,body{margin:0;padding:0;background:#000;;} ..

发布时间：2020-04-24 10:08:51 javascript java android jsoup Java开发

Selenium jSoup从Javascript网页获取数据

最近已经问了几个问题，但是还没有真正找到我想要的东西. 我正在尝试从 http://www获得所有匹配项.futbol24.com/Live/?__ igp = 1& LiveDate = 20141106 打印出来，包括时间，主队和客队.我了解页面加载后会加载内容. 有人告诉我要使用Selenium，然后对结果使用jSoup来获取所需的数据.是否有人可以在上面的网站上给我看一些教程或 ..

发布时间：2020-04-24 10:08:39 java javascript selenium jsoup Java开发

使用jsoup解析xml(同时避免使用< p>标签)

这个问题本质上与 LEAD: Two police officers responding to a reported robbery at a Brooklyn tavern early yesterday were themselves held up by the robbers, who too ..

发布时间：2020-04-24 10:08:32 java jsoup Java开发

如何从div中选择特定元素?

我想从该div获取日期: Date Qualified 2013-03-08 12:04:01 所以输出将是:2013-03-08 我试图这样做: elements = ..

发布时间：2020-04-24 10:08:04 java html jsoup selector Java开发

在jsoup中解析之前如何暂停?

我需要在解析之前暂停我的脚本(我想等待一些信息)，但是如何在Jsoup中做到这一点? 我尝试过: link = Jsoup.connect("link").wait(100).get(); 但这对我不起作用. 解决方案通常，通过AJAX加载内容时需要等待. Jsoup无法处理此类问题，因为它不是浏览器. Jsoup只是解释HTML.连接的内容或多或少只是Java连接的包装 ..

发布时间：2020-04-24 10:08:02 java parsing jsoup Java开发

Jsoup返回状态400

我要从以下URL抓取数据: 所以我写了以下代码 import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import static org.jsoup.Connection.*; /** * Created by avi on 11/24/17. */ public ..

发布时间：2020-04-24 10:07:59 java web-crawler jsoup Java开发

Android:将外部库添加到项目中无法正常工作

我正在尝试将Jsoup库添加到我的项目中，但是程序中出现错误提示“无法解析符号'Jsoup'".以下是我已经完成的工作，但是没有正常工作. 1)我从Jsoup网站下载了核心库jsoup-1.10.2.jar 2)将.jar文件拖放到我的项目的libs文件夹下 3)在build.gradle中的依赖项下，我添加了以下行 compile files('libs/jsoup-1.10.2 ..

发布时间：2020-04-24 10:07:57 java android jsoup libs Java开发

我有一个URL( http://myURL.com )，我从该URL中读取内容网页.问题是我只能阅读page1的内容.给定分页页面的page2 URL时，在使用page2内容读取page2内容时仍使用jsoup API，但它在打印时显示的是page1的内容，而不是显示page2的内容，但是在浏览器中打开page2 URL时，它显示的是内容Web浏览器中page2的大小.关于出现分页时如何阅读其他页 ..

发布时间：2020-04-24 10:07:54 java pagination web-crawler jsoup Java开发

删除所有HTML标记

我有一个字符串，其中包含完整的XML get请求. 在请求中，有很多HTML和一些我想删除的自定义命令. 我知道的唯一方法是使用 jSoup . 例如像这样. 现在，由于请求来自的网站还具有自定义命令，因此我无法完全删除所有代码. 例如，这是我要' clean '的字符串: \u0027s normal text here\u003c/b\u003e http: ..

发布时间：2020-04-24 10:07:50 java regex jsoup Java开发

jsoup相关内容