HTML抓取的选项? [英] Options for HTML scraping?
本文介绍了HTML抓取的选项?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我正在考虑尝试 Beautiful Soup ,一个用于HTML抓取的Python包。有没有其他的HTML抓取包我应该看? Python不是必需品,我其实也有兴趣听到其他语言。
迄今为止的故事:
- Python
- Ruby
- .NET
- Perl
- JavaScript
- PHP
- 其中大部分是
Ruby class =h2_lin>解决方案