cheerio相关内容

节点js console.log没有显示任何内容

我正在尝试使用节点js抓取网页,我想我已经编写了代码并且能够无任何错误地运行它,但是问题是无论我做什么,控制台都不会打印任何内容。没有显示任何错误。什么原因? 以下是我要剪贴的内容: https://paste.ee/r/b3yrn var fs = require('fs') ; var request = require(’request’); var cheerio ..
发布时间:2020-10-01 06:03:03 前端开发

回调cheerio node.js

我正在尝试使用“ request”和“ cheerio”编写剪贴簿。我有100个网址的数组。我遍历数组,在每个URL上使用“ request”,然后执行cheerio.load(body)。如果我将i增大到3以上(即将其更改为i≤3以进行测试),则刮板将中断,因为var productNumber是未定义的,并且我无法对未定义的变量调用split。我认为for循环正在网页响应之前进行,并且有时间用 ..
发布时间:2020-10-01 06:03:00 其他开发

无法使用回调获取结果

我已经在 node 节点中使用两个不同的函数 getPosts()和 getContent()在其中提供回调,以打印调用独立函数 getResult()的结果。 但是,当我执行脚本时,它不会打印任何内容。它也不会引发任何错误。我尝试模仿 Neil 所提供的逻辑-print-the-content-of-other-function / 55594953?noredirect = 1#comm ..
发布时间:2020-10-01 06:01:58 其他开发

Cheerio.load弄乱了Google Assistant的响应

我的意图是调用了cheerio.load(),并且使响应混乱。 Google助手不断告诉我,即使稍后在我有回复的代码中也没有设置任何回复。控制台还告诉我,异步调用没有返回到处理程序,我相信它是cheerio.load()。无论如何,我可以解决此问题,以便它继续在代码底部查找正确的conv.ask吗?它仍然继续向下运行,直到显示console.log(map)。谢谢您的帮助! app.int ..
发布时间:2020-10-01 06:01:43 其他开发

节点js将节点或元素添加到xml文件

如何在node js express中添加新的节点/元素或更新xml文件? 我尝试使用cheerio,我的代码是: $ = cheerio.load(“ my.xml” ,{xmlMode:true}); $(“ urlset”)。append(’ www.google.com’)); 解决方案 您只需将整个XM ..
发布时间:2020-10-01 06:01:36 其他开发

将Cheerio.js添加到Angular 6项目中?

我创建了一个全新的Angular 6项目并安装了Cheerio.js: npm install cheerio 一旦安装了Cheerio.js,我发现将其添加到项目中所要做的就是导入并将其添加到NgModule导入中: import'@ angular / platform-b​​rowser'的{BrowserModule};从“ @ angular / core”导入 { ..
发布时间:2020-10-01 06:01:23 其他开发

Cheerio不等待身体加载

我制作了一个非常简单的脚本,该脚本抓取了一个食谱网站,以获取标题,准备时间和配料。一切工作正常,但脚本无法抓取数组的每一页。有时我会得到其中的4个,有时是2个,有时甚至是0 ... 似乎脚本不会等待正文完全加载。我完全知道cheerio不了解网站上的javascript,但就我所知,我所刮取的信息并非来自任何脚本,而是纯HTML。 我该如何要求cheerio在访问页面时等待1秒,或者只 ..
发布时间:2020-10-01 06:01:19 其他开发

刮Google翻译

我想使用NodeJS和cheerio库抓取Google Translate: request(“ http://translate.google .de /#de / en / hallo%20welt“,function(err,resp,body){ if(err)throw err; $ = cheerio.load(body); console.log($('#res ..
发布时间:2020-10-01 06:01:12 其他开发

使用cheerio替换属性值

以下代码用于替换所有 标记 src 的值。但是以下代码不会修改原始文档。 $。html 打印原始文档,而不打印修改后的文档。 $ = cheerio.load(数据); $(“ img”)。each(function(){ var old_src = $(this).attr(“ src”); var new_src =“ / my_cached_image?url ..
发布时间:2020-10-01 06:01:09 前端开发

从Facebook页面中提取公开帖子,而无需API / APP密钥/令牌/秘密

为了提前澄清,我没有Facebook帐户,也无意创建一个帐户。另外,我要实现的目标在我的国家和美国是完全合法的。 而不是使用Facebook API来获取Facebook页面的最新时间线帖子,我想直接将获取请求发送到页面URL(例如此页面 ),然后从HTML源代码中提取帖子。 (我想获取帖子的文字和创建时间。) 在Web控制台中运行此命令时: document.getEl ..
发布时间:2020-10-01 06:01:02 前端开发

Node.js + request + for循环:运行两次

我使用cheerio创建了一个简单的刮板,并请求客户端,但是它不能按照我想要的方式工作。 首先,我看到所有的“ null返回,什么也不做”,然后查看名称,所以我认为它首先检查所有返回null的URL,然后再返回非null。 我希望它运行以正确的顺序从1到100。 app.get('/ back',function(req,res){ for(var y = 1; y ..
发布时间:2020-10-01 06:00:58 其他开发

具有cheerio和request的节点js中的增量和非增量url

我正在尝试使用cheerio从网页中抓取数据并按以下方式请求: 1)转到网址1a( http://example.com/0 ) 2)提取网址1b( http://example2.com/52 ) 3)转到网址1b 4)提取一些数据并保存 5)转到网址1a + 1( http://example.com/1 ,我们称其为2a) 6)提取网址2b( http://example2. ..
发布时间:2020-10-01 06:00:57 其他开发

使用Meteor.js进行抓取

我可以刮一下meteor.js吗?刚刚发现 cheerio 与请求结合使用效果很好。我可以将它们与流星一起使用吗?还是有类似的东西? 您有一个可行的示例吗? 解决方案 当然!很难想象流星不能做什么!首先,您需要一些东西来处理远程http请求。在终端的流星目录中,运行 meteor添加http 以添加 Meteor.http 包,也添加 npm install cheerio (请查看 ..
发布时间:2020-10-01 05:59:54 其他开发