使用Node.Js中的请求抓取JavaScript生成的内容 [英] Scraping javascript generated content using request in Node.Js

查看：76 发布时间：2019/11/6 14:51:50 javascript jquery node.js node-request

本文介绍了使用Node.Js中的请求抓取JavaScript生成的内容的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我需要从Google搜索结果中抓取一些仅在浏览器中显示的内容(我怀疑是在启用Javascript的时候)–具体来说，他们的知识图谱人们也在搜索"内容.

I need to scrape some content from Google search results that only shows in browsers (I suspect it's when Javascript is enabled) – specifically, their Knowledge Graph "People also search for" content.

我使用了request和cheerio的组合进行抓取，并且已经设法从.com域中强制加载结果，但是，知识库框未显示在结果的body中，可能是因为它是javascript生成的内容.

I use a combination of request and cheerio to scrape and has already managed to force-load results from .com domain, however, the knowledgebase box does not show up in the body of my results, probably because it's javascript-generated content.

有人知道我可以添加一项设置还是可以使用另一个库吗?

Anybody knows if there's a setting I could add or another library I could use?

这是下面的代码.谢谢！

Here's my code below. Thank you!

var request = require('request');
var cheerio = require("cheerio");

request = request.defaults({jar: true});

var options = {
    url: 'http://www.google.com/ncr',
    headers: {
        'User-Agent': 'Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.6; rv:1.9.2.16) Gecko/20110319 Firefox/3.6.16'
    }
};

request(options, function () {

    request('https://www.google.com/search?gws_rd=ssl&site=&source=hp&q=google&oq=google', function (error, response, body) {

        var $ = cheerio.load(body);

        $("li").each(function() {
            var link = $(this);
            var text = link.text();

            console.log(text);
        });
    });
});

使用Node.Js中的请求抓取JavaScript生成的内容 [英] Scraping javascript generated content using request in Node.Js

问题描述

推荐答案

相关文章

前端开发最新文章

热门教程

热门工具

登录关闭

使用Node.Js中的请求抓取JavaScript生成的内容 [英] Scraping javascript generated content using request in Node.Js

问题描述

推荐答案

相关文章

前端开发最新文章

热门教程

热门工具

登录 关闭

登录关闭