用于将HTML文件读为XML(.NET)的库 [英] Library for reading HTML files as XML (.NET)

查看:119
本文介绍了用于将HTML文件读为XML(.NET)的库的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

重复: 寻找C#HTML解析器。请关闭。



你能推荐一个用于在HTML中将HTML文件读为XML的库吗?我实际上更喜欢处理XML对象而不是文本。理想情况下,它必须修复HTML格式错误。 您可能想重新考虑这一点。这两个不相等。

一个很好的例子就是自闭标签。

XML标准指出自闭标签如下所示:

 <峰; br /> 

而html标准具有非内容标记作为单个标记

 < br> 
< link rel =...>

在html中,使用xml语法实际上是违规行为,如 /> gt ; 具有不同的含义。

以下文章


Duplicate: Looking for C# HTML parser. Please close.

Can you recommend me a library for reading HTML files as XML in .NET? I'd actually prefer to deal with XML objects rather than text. Ideally, it must fix HTML formatting errors.

解决方案

You may want to rethink this. The two are not equal.

a great example of this is self closing tags.

XML standard indicates that a self closing tag looks like the following:

<br/>

while html standards has non-content tags as single tags

<br>
<link rel="...">

In html, using the xml syntax actually is a violation, as /> has a different meaning.

There are more examples of these issues in the following article.

这篇关于用于将HTML文件读为XML(.NET)的库的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆