网络抓取选项 - 仅限C ++版本 [英] Options for web scraping - C++ version only

查看:133
本文介绍了网络抓取选项 - 仅限C ++版本的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我在寻找一个用于网页抓取的好的C ++库。

必须是C / C ++和请勿指示我访问 HTML抓取选项或其他SO问题/答案,其中C ++甚至不

I'm looking for a good C++ library for web scraping.
It has to be C/C++ and nothing else so please do not direct me to Options for HTML scraping or other SO questions/answers where C++ is not even mentioned.

推荐答案


  • libcurl 下载html文件

  • libtidy 可转换为有效的xml

  • libxml 来解析/导航xml

    • libcurl to download the html file
    • libtidy to convert to valid xml
    • libxml to parse/navigate the xml
    • 这篇关于网络抓取选项 - 仅限C ++版本的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆