如何使用 Node/Cheerio(或其他东西)从站点中抓取全局变量? [英] How can I use Node / Cheerio (or something else) to scrape a global variable from a site?

查看:37
本文介绍了如何使用 Node/Cheerio(或其他东西)从站点中抓取全局变量?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

页面上有一个全局变量,其中包含我想为其设置抓取工具的对象.使用 Node/Express/潜在的 Cheerio 执行此操作的最佳方法是什么?

There is a global variable on a page that contains an object that I'd like to set up a scraper for. What's the best way to do this with Node / Express / potentially Cheerio?

我了解 Cheerio 在遍历 DOM 方面的好处,但我知道我想要抓取的全局变量的名称,只需要按设定的时间表提取其信息

I understand Cheerio's benefit in traversing a DOM, but I know the name of the global variable I want to scrape and just need to extract its information on a set schedule

推荐答案

Cheerio 只是一个 dom 解析器,因此您无法访问任何 javascriot 或任何 javascript 生成的内容.

Cheerio is just a dom parser, so you wont have acces to any javascriot or any javascript generated content.

您需要的是模拟浏览器的类似 PhantomJS 的东西.看看这个 Stackoverflow 答案

What you need is something like PhantomJS that simulates a browser. Have a look at this Stackoverflow answer

这篇关于如何使用 Node/Cheerio(或其他东西)从站点中抓取全局变量?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆