使用scrapy在没有javascript代码的情况下抓取文本 [英] Scraping text without javascript code using scrapy

查看:31
本文介绍了使用scrapy在没有javascript代码的情况下抓取文本的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我目前正在使用scrapy设置一堆蜘蛛.这些蜘蛛应该从目标站点仅提取文本(文章、论坛帖子、段落等).

问题是:有时,我的目标节点包含一个 <script> 标签,因此抓取的文本包含 javascript 代码.

这是一个链接 到我正在使用的真实示例.在这种情况下,我的目标节点是 //td[@id='contenuStory'].问题是在第一个子 div 中有一个

登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆