jsoup相关内容

如何在 Volley 中使用 Jsoup?

我有一个 Jsoup 和 AsyncTask 的工作示例,效果很好.我只是对性能不满意.加载带有文本和图像的简单列表页面需要 3-6 秒. 我想以某种方式提高性能......所以我偶然发现了截击. 谁能解释一下如何在 jsoup 中使用 volley? 我用它来获取包含特定 URL 的 doc 对象: public Document GetDocument(String si ..
发布时间:2021-11-27 23:17:04 移动开发

jsoup 发布和 cookie

我正在尝试使用 jsoup 登录到一个站点,然后抓取信息,我遇到了一个问题,我可以成功登录并从 index.php 创建一个文档,但我无法获取站点上的其他页面.我知道我需要在发布后设置一个 cookie,然后在我尝试打开站点上的另一个页面时加载它.但是我该怎么做呢?下面的代码让我登录并获取 index.php Document doc = Jsoup.connect("http://www.ex ..
发布时间:2021-11-25 16:30:29 Java Web开发

如何“扫描"信息的网站(或页面),并将其带入我的程序?

嗯,我非常想弄清楚如何从网页中提取信息,并将其带入我的程序(在 Java 中). 例如,如果我知道我想要信息的确切页面,为了简单起见,Best Buy 商品页面,我将如何从该页面获取我需要的适当信息?喜欢标题,价格,描述? 这个过程甚至会被称为什么?我什至不知道要开始研究这个. 编辑:好的,我正在对 JSoup(BalusC 发布的那个)进行测试,但我不断收到此错误: 线程“m ..
发布时间:2021-11-25 15:28:02 Java Web开发

Jsoup Java HTML 解析器:执行 Javascript 事件

我可以在 Jsoup 中填写表格、执行事件和 Javascript 函数吗?如果是,我该怎么办?或者我应该换一个解析器. 解决方案 JSoup 只是一个 HTML 解析器/“tidyfier"——而不是浏览器模拟器.要与 HTML 页面交互(执行 javascript、填写表单等),您应该使用类似 HtmlUnit 或硒. ..
发布时间:2021-11-25 13:48:36 Java Web开发

页面内容加载了 JavaScript 而 Jsoup 看不到它

页面上的一个块由 JavaScript 填充了内容,在使用 Jsoup 加载页面后,没有任何信息.使用 Jsoup 解析页面时,有没有办法获取 JavaScript 生成的内容? 无法在此处粘贴页面代码,因为它太长:http://pastebin.com/qw4Rfqgw 这是我需要的内容元素: 我需要用 Java 获取这些信息 ..
发布时间:2021-11-25 13:04:17 Java Web开发

如何使用 Jsoup 从 Google 获取#resultStats

我正在尝试获取 Google 向我们展示的文章数量: This 是对 jeb Bush barack obama 的 Google 搜索,它显示了我需要的数量,也就是 10,200,000 篇文章 如何使用 Jsoup 及其任何组件来获取该数字? 我试过了: Document document = Jsoup.connect(url).get();Elements descri ..
发布时间:2021-11-21 20:20:54 Android

如何使用 Jsoup 从 Google 获取#resultStats

我正在尝试获取 Google 向我们展示的文章数量: This 是对 jeb Bush barack obama 的 Google 搜索,它显示了我需要的数量,也就是 10,200,000 篇文章 如何使用 Jsoup 及其任何组件来获取该数字? 我试过了: Document document = Jsoup.connect(url).get();Elements descri ..
发布时间:2021-11-21 20:18:23 Android

为什么我的 Jsoup 代码没有返回正确的元素?

我正在 Android Studio 中开发一个应用程序,并且在使用 JSoup 进行网络抓取时遇到了一些问题.我已经成功连接到网页并返回了一些基本元素来测试库,但现在我实际上无法获得我的应用程序所需的元素. 我正在尝试使用“data-at"获取多个元素属性.奇怪的是,一些元素带有“data-at"属性被返回,但不是我正在寻找的那些.无论出于何种原因,我的代码都没有提取所有共享“data-a ..
发布时间:2021-11-21 18:30:03 Android

Java-用JSoup 抓取动态网站

我想用 JSoup 抓取一个网站.该网站是动态的,每秒钟左右更新一次.我很确定它使用了 JQuery,它更新了 HTML 中的一些标签.我正在使用 JSoup,但动态区域是空白的.JSoup 有什么特别的方法可以解决这个问题吗?或者这是一个限制?编辑:我打算把它放在我网站上的 Java 小程序中. 解决方案 听起来您希望 JSoup 表现得像一个支持 JavaScript 的浏览器.恐怕不 ..
发布时间:2021-11-16 22:21:47 其他开发

使用 AsyncTask 和 Jsoup 发布 APK 时出错

我收到此错误: 03-04 09:55:55.915: W/dalvikvm(20171): 异常 Ljava/lang/NullPointerException;初始化 La/a/b/k 时抛出;03-04 09:55:55.915:W/dalvikvm(20171):异常Ljava/lang/ExceptionInInitializerError;初始化 La/a/b/l 时抛出;03-04 ..
发布时间:2021-11-15 21:33:39 其他开发

如何使用java填写Excel文件

我有以下代码填写Excel文件,我使用 Jsoup 从互联网上获得的信息. package knvbj;导入 java.io.FileInputStream;导入 java.io.FileOutputStream;导入 java.io.IOException;导入 java.io.InputStream;导入 java.util.List;导入 org.apache.poi.ss.usermod ..
发布时间:2021-11-12 04:36:34 其他开发

如何使用 Jsoup (Java) 检索 Youtube 的自动完成结果?

如图所示,我想使用 Jsoup 检索自动完成搜索结果.我已经在使用视频 ID 检索视频网址、视频标题和缩略图,但我一直无法从搜索结果中检索它们. 我必须在不使用 Youtube 的 Data Api 并且只使用 Jsoup 的情况下完成此操作. 任何可以为我指明正确方向的建议将不胜感激. 解决方案 搜索结果是通过 JavaScript 动态生成的.这意味着它们无法被 Jsoup ..
发布时间:2021-09-24 18:49:57 其他开发

Java HTML 使用无限滚动解析页面

如果页面具有无限滚动,我如何在 Java 中抓取页面的 HTML?我目前正在以这种方式抓取页面: URL url = new URL(stringUrl);URLConnection con = url.openConnection();InputStream in = con.getInputStream();字符串编码 = con.getContentEncoding();编码 = 编码 = ..
发布时间:2021-09-23 20:00:56 其他开发

angularjs web中的jsoup输出

doc = Jsoup.connect("https://www.example.com/p/laptop-aksesoris").get();元素 element = doc.select("div.product-card a").first();Elements elements = element.getElementsByAttribute("href");for(元素e:元素){Sys ..
发布时间:2021-09-22 19:56:24 其他开发

如何使用 Javascript 或 jQuery(跨域)CORS(无 api)从另一个网站提取数据

目标是获取电报群的成员总数.这个数字有一个唯一的 css 标识符,应该可以通过 jsoup 或其他方法获取. 使用电报 api 需要身份验证令牌,并使用这种方法我试图解决可能最终在其他地方使用的任何 api 密钥,因为此代码将用于开源项目并且最终可能导致密钥被泄露. 我正在尝试从此网站提取数据:https://api.allorigins.win/raw?url=https://tgs ..
发布时间:2021-09-04 20:31:43 其他开发

使用Jsoup提取文本

我正试图从以下页面获取信息: http://fantasynews.cbssports.com/fantasyfootball/players/updates/187741 我需要为每个项目获取单独的字符串: 新闻标题 新闻 分析 现在,我可以使用以下方法从整个表格中获取信息: doc = Jsoup.connect("http://fantasynews.cbsspor ..
发布时间:2021-05-28 18:36:23 其他开发