Objective C 中的网页抓取 [英] Web scraping in Objective C
问题描述
是否有任何用于解析 HTML 的 Objective C 库,例如 python 的 BeautifulSoup?谢谢
is there any Objective C library for parsing HTML, like python's BeautifulSoup? Thanks
推荐答案
Apple 的部分有 NSXMLDocument 和 NSXMLParser,支持整理的 HTML 输入.(基于树的 XML 编程指南一>)
From Apple's part there is NSXMLDocument and NSXMLParser, which support tidied HTML input. (Tree-Based XML Programming Guide)
在 iOS (4.3) 上,目前没有 NSXMLDocument 可用,因此您必须使用 NSXMLParser 或 libxml2.2.
On iOS (4.3) there's currently no NSXMLDocument available, so you'd have to use either NSXMLParser or libxml2.2.
有关解析格式错误的 HTML 的潜在问题的更多信息:
在 iOS 中解析 XML/屏幕抓取"的最佳方法是什么?UIWebview 还是 NSXMLParser?
Some more informations on potential problems with parsing malformed HTML:
What's the best approach for parsing XML/'screen scraping' in iOS? UIWebview or NSXMLParser?
最可靠的解决方案是使用离屏 WebView,将 HTML 源代码加载到其中,然后访问其 DOM 树.
这篇关于Objective C 中的网页抓取的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!