Java regex 去除 XML 标签,但不去除标签内容 [英] Java regex to strip out XML tags, but not tag contents

查看:28
本文介绍了Java regex 去除 XML 标签,但不去除标签内容的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有以下 Java 代码:

I have the following Java code:

str = str.replaceAll("<.*?>.*?</.*?>|<.*?/>", "");

这会像这样转换一个字符串:

This turns a String like so:

How now <fizz>brown</fizz> cow.

进入:

How now  cow.

但是,我希望它只是去除 <fizz></fizz> 标签,或者只是独立的 </fizz> 标签,并保留元素的内容.所以,一个正则表达式可以把上面的内容变成:

However, I want it to just strip the <fizz> and </fizz> tags, or just standalone </fizz> tags, and leave the element's content alone. So, a regex that would turn the above into:

How now brown cow.

或者,使用更复杂的字符串,转过来的东西:

Or, using a more complex String, somethng that turns:

How <buzz>now <fizz>brown</fizz><yoda/></buzz> cow.

进入:

How now brown cow.

我试过了:

str = str.replaceAll("<.*?></.*?>|<.*?/>", "");

这根本行不通.有任何想法吗?提前致谢!

And that doesn't work at all. Any ideas? Thanks in advance!

推荐答案

"How now <fizz>brown</fizz> cow.".replaceAll("<[^>]+>", "")

这篇关于Java regex 去除 XML 标签,但不去除标签内容的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆