Java regex 去除 XML 标签,但不去除标签内容 [英] Java regex to strip out XML tags, but not tag contents
本文介绍了Java regex 去除 XML 标签,但不去除标签内容的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有以下 Java 代码:
I have the following Java code:
str = str.replaceAll("<.*?>.*?</.*?>|<.*?/>", "");
这会像这样转换一个字符串:
This turns a String like so:
How now <fizz>brown</fizz> cow.
进入:
How now cow.
但是,我希望它只是去除 <fizz>
和 </fizz>
标签,或者只是独立的 </fizz
> 标签,并保留元素的内容.所以,一个正则表达式可以把上面的内容变成:
However, I want it to just strip the <fizz>
and </fizz>
tags, or just standalone </fizz
> tags, and leave the element's content alone. So, a regex that would turn the above into:
How now brown cow.
或者,使用更复杂的字符串,转过来的东西:
Or, using a more complex String, somethng that turns:
How <buzz>now <fizz>brown</fizz><yoda/></buzz> cow.
进入:
How now brown cow.
我试过了:
str = str.replaceAll("<.*?></.*?>|<.*?/>", "");
这根本行不通.有任何想法吗?提前致谢!
And that doesn't work at all. Any ideas? Thanks in advance!
推荐答案
"How now <fizz>brown</fizz> cow.".replaceAll("<[^>]+>", "")
这篇关于Java regex 去除 XML 标签,但不去除标签内容的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文