使用 HtmlAgilityPack 解析 XML [英] XML Parsing with HtmlAgilityPack

查看:53
本文介绍了使用 HtmlAgilityPack 解析 XML的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我在 WebService 辅助角色上使用 HtmlAgilityPack 解析 xml,但有一些问题.当我选择子节点链接"时,得到空字符.xml如:

I'm parsing xml with HtmlAgilityPack on WebService worker role, but there is something wrong. When I select childnode "link" get empty char. the xml like :

<link>
http://www.webtekno.com/google/google-ve-razer-dan-oyun-konsolu.html
</link>

我从 rss 获取链接的代码是:

my code for get link from rss is:

HtmlNodeCollection nodeList = doc.DocumentNode.SelectNodes("//item");
foreach (HtmlNode node in nodeList)
{
    string newsUri = node.ChildNodes["link"].InnerText;
}

我认为获取空字符是因为链接节点包含新行和链接后.如何在节点中获取链接?

I think gets empty char cause link node includes new line and after link. How can I get link in the node?

推荐答案

在加载 HtmlDocument 之前放置该行

Put that line before loading HtmlDocument

HtmlNode.ElementsFlags["link"] = HtmlElementFlag.Closed;

仅此而已.

默认情况下,它的值为 HtmlElementFlag.Empty 并被视为 metaimg 标签...

By default, its value is HtmlElementFlag.Empty and treated like meta and img tags...

这篇关于使用 HtmlAgilityPack 解析 XML的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆