如何获得文字和使用Jericho HTML解析器的特定标签之间的其他标签? [英] How to get text & Other tags between specific tags using Jericho HTML parser?

查看:190
本文介绍了如何获得文字和使用Jericho HTML解析器的特定标签之间的其他标签?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个包含特定标记的HTML文件,例如< TABLE cellspacing = 0> ,结束标记为< / TABLE> 。现在我希望获得这些标签之间的所有内容。我在Java中使用Jericho HTML解析器来解析HTML。是否有可能得到文本&杰里科解析器中特定标签之间的其他标签?

I have a HTML file which contains a specific tag, e.g. <TABLE cellspacing=0> and the end tag is </TABLE>. Now I want to get everything between those tags. I am using Jericho HTML parser in Java to parse the HTML. Is it possible to get the text & other tags between specific tags in Jericho parser?

例如:

<TABLE  cellspacing=0>    
  <tr><td>HELLO</td>  
  <td>How are you</td></tr>
</TABLE>

答案:

<tr><td>HELLO</td>  
<td>How are you</td></tr> 


推荐答案

找到桌子的元素后,全部你要做的就是调用getContent()。toString()。以下是使用示例HTML的简单示例:

Once you have found the Element of your table, all you have to do is call getContent().toString(). Here's a quick example using your sample HTML:

Source source = new Source("<TABLE  cellspacing=0>\n" +
    "  <tr><td>HELLO</td>  \n" +
    "  <td>How are you</td></tr>\n" +
    "</TABLE>");

Element table = source.getFirstElement();
String tableContent = table.getContent().toString();

System.out.println(tableContent);

输出:

    <tr><td>HELLO</td>  
    <td>How are you</td></tr>

这篇关于如何获得文字和使用Jericho HTML解析器的特定标签之间的其他标签?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆