cheerio相关内容

如何修复 Node/Cheerio 中的“$(...).click is not a function"

我正在用 node.js 编写一个应用程序,它将导航到一个网站,点击网站上的一个按钮,然后从网站中提取某些数据.除了单击按钮方面外,一切都进行得很顺利.我似乎无法模拟按钮点击.我对此非常陌生,所以我很感激你们的任何建议!遗憾的是,我已经在互联网上寻找解决此问题的方法,但一直找不到. 我在使用“request"和“cheerio"的 .js 文件中使用了 .click() 和 .bind('c ..
发布时间:2022-01-05 15:49:38 前端开发

如何使用 Node/Cheerio(或其他东西)从站点中抓取全局变量?

页面上有一个全局变量,其中包含我想为其设置抓取工具的对象.使用 Node/Express/潜在的 Cheerio 执行此操作的最佳方法是什么? 我了解 Cheerio 在遍历 DOM 方面的好处,但我知道我想要抓取的全局变量的名称,只需要按设定的时间表提取其信息 解决方案 Cheerio 只是一个 dom 解析器,因此您无法访问任何 javascriot 或任何 javascript ..
发布时间:2021-12-17 14:17:19 其他开发

使用 Cheerio、NodeJs 从文件中附加 HTML

我正在尝试使用cheerio将文件中的一些html附加到一些现有的html中,但我不断收到错误(这些错误是由cheerio库产生的,因此调试很困难) expo.includeNav = function(html, result){var file = 'templates/admin_nav.html';fs.readFile(文件,函数(错误,导航){var $ =cheerio.load( ..
发布时间:2021-11-16 19:46:36 前端开发

使用 Cheerio、NodeJs 从文件中附加 HTML

我正在尝试使用cheerio将文件中的一些html附加到一些现有的html中,但我不断收到错误(这些错误是由cheerio库产生的,因此调试很困难) expo.includeNav = function(html, result){var file = 'templates/admin_nav.html';fs.readFile(文件,函数(错误,导航){var $ =cheerio.load( ..
发布时间:2021-11-16 19:46:08 前端开发

如果我要抓取的图像受 cloudflare 保护并出现 1020 错误,有没有办法使用cheerio 抓取网站?

我正在尝试创建一个漫画抓取网站作为个人项目,就在我完成整个网站时,我才知道我的网站无法抓取或查看图像,当我尝试转到图像,我收到 1020 错误,说明访问被拒绝,有什么方法可以绕过该错误,而无需从网站所有者那里获得授权令牌, 如果答案是否定的,那么谁能解释一下 cloudflare 如何保护图像不被抓取,因为据我所知,前端的所有内容都可以被抓取. 编辑:这是图像之一我想抓取,但是当我在浏 ..
发布时间:2021-09-24 18:50:27 前端开发

按顺序提取文本标签-如何完成?

我正在尝试在HTML中查找所有文本以及父标记.在下面的示例中,名为 html 的变量具有示例HTML,在该示例中,我尝试提取标记和文本.这可以正常工作,并且按预期给出了带有 text 的 tags 在这里,我已经使用 cheerio 遍历DOM. cheerio 与 jquery 完全相同. const cheerio = require("cheerio");const html =` ..
发布时间:2021-04-21 20:52:49 前端开发

如何修复Node/Cheerio中的'$(...).click不是函数'

我正在用node.js编写一个应用程序,该应用程序将导航到一个网站,单击该网站上的一个按钮,然后从该网站中提取某些数据.除单击按钮方面外,其他所有方面都进行得很好.我似乎无法模拟按钮单击.我对此非常陌生,因此,如果您有任何建议,我将不胜感激!可悲的是,我搜寻了互联网,以寻求解决此问题的方法,但未能找到解决方法. 我在使用'request'和'cheerio'的.js文件中使用了 .click ..
发布时间:2021-04-21 20:52:44 前端开发

使用cheerio获取页面标题

我正在尝试使用cheerio获取URL的标题标签.但是,我得到的是空字符串值.这是我的代码: app.get('/scrape',function(req,res){url ='http://nrabinowitz.github.io/pjscrape/';request(url,function(error,response,html){如果(!错误){var $ = cheerio.loa ..
发布时间:2021-04-21 20:52:38 前端开发

刮擦所有元素

我正在运行以下代码来抓取数据.但是,代码只刮取第一个元素. const cheerio = require('cheerio')const jsonframe = require('jsonframe-cheerio')const got = require('got');异步函数scrapeCoinmarketCap(){const url ='https://coinmarketcap.c ..
发布时间:2021-04-21 20:52:35 前端开发

Node.js + Cheerio:循环内请求

我正在使用cheerio,request和Node.js. 当我运行以下脚本时,它以错误的顺序输出名称.我相信它是由它的异步性质引起的,如何使它按“正确"的顺序工作?我是否需要使用同步程序包,或者是否可以通过某种方式对其进行更改,使其能够以同步方式工作? app.get('/returned',function(req,res){对于(var y = 0; y 我首先创建了一个要获 ..
发布时间:2021-04-21 20:52:29 其他开发