网络爬虫在Perl中支持JavaScript? [英] Web Crawler with JavaScript support in Perl?

查看:289
本文介绍了网络爬虫在Perl中支持JavaScript?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我要codeA perl的应用程序,将抓取一些网站,并收集图片链接从这些网页。因为大多数网页使用的JavaScript 生成一个 HTML 内容,我需要code准支持JavaScript的客户端浏览器能够为解析所生成和/或由JavaScript修改的最终的HTML code。我有哪些选择?

I want to code a perl application that would crawl some websites and collect images and links from such webpages. Because the most of pages use JavaScript that generate a HTML content, I need to code quasi a client browser with JavaScript support to be able to parse a final HTML code that is generated and/or modified by JavaScript. What are my options?

如果可能的话,请公布一些实施code或连结一些示例(S)。

If possible, please publish some implementation code or link to some example(s).

推荐答案

有几种选择。

  • Win32::IE::Mechanize on Windows
  • Mozilla::Mechanize
  • WWW::Mechanize::Firefox
  • WWW::Selenium
  • Wight

这篇关于网络爬虫在Perl中支持JavaScript?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆