从包含在scrapy python中的javascript的div通过xpath抓取数据 [英] scrape data through xpath from div that contains javascript in scrapy python

查看：30 发布时间：2021/7/16 22:18:18 javascript python xpath scrapy

本文介绍了从包含在scrapy python中的javascript的div通过xpath抓取数据的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我正在使用 scrapy，我正在抓取网站并使用 xpath 抓取项目.但是一些 div 包含 javascript，所以当我使用 xpath 时，直到包含 javascript 代码的 div id 返回一个空列表，并且没有包括那个 div 元素(其中包含 javascript)可以获取 HTML 数据

HTML 代码


<div id="contentDetails"><div class="eventDetails"><h2><a href="javascript:;"onclick="jdevents.getEvent(117032)">一些数据</a>

蜘蛛代码

class ExampleSpider(BaseSpider):名称 = "示例"domain_name = "www.example.com"start_urls = ["http://www.example.com/jkl/index.php"]定义解析(自我，响应):hxs = HtmlXPathSelector(响应)required_data = hxs.select('//div[@class="subContent2"]/div[@id="contentDetails"]/div[@class="eventDetails"]')

那么我怎样才能从上面提到的 h2 元素 内的 anchor tag 中获取 text(Some data) ，是否有任何替代从scrapy中包含javascript的元素中获取数据的方法

解决方案


<div id="contentDetails"><div class="eventDetails"><h2><a href="javascript:;"onclick="jdevents.getEvent(117032)">一些数据</a>

<div class="subContent2"> <div id="contentDetails"> <div class="eventDetails"> <h2> <a href="javascript:;" onclick="jdevents.getEvent(117032)">Some data</a> </h2> </div> </div> </div>

class ExampleSpider(BaseSpider): name = "example" domain_name = "www.example.com" start_urls = ["http://www.example.com/jkl/index.php"] def parse(self, response): hxs = HtmlXPathSelector(response) required_data = hxs.select('//div[@class="subContent2"]/div[@id="contentDetails"]/div[@class="eventDetails"]')

<div class="subContent2"> <div id="contentDetails"> <div class="eventDetails"> <h2> <a href="javascript:;" onclick="jdevents.getEvent(117032)">Some data</a> </h2> </div> </div> </div>

从包含在scrapy python中的javascript的div通过xpath抓取数据 [英] scrape data through xpath from div that contains javascript in scrapy python

问题描述

相关文章

前端开发最新文章

热门教程

热门工具

登录关闭

从包含在scrapy python中的javascript的div通过xpath抓取数据 [英] scrape data through xpath from div that contains javascript in scrapy python

问题描述

相关文章

前端开发最新文章

热门教程

热门工具

登录 关闭

登录关闭