使用正则表达式删除不必要的结束标记 [英] Remove unnecessary close tags using regex

查看:12
本文介绍了使用正则表达式删除不必要的结束标记的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在寻找一个regex,它删除结束标记和所有内容,直到找到一个开始标记。例如:

</xy>..</zz>..<a>...-><a>...

</b>..</cc>..<a href="#">...</a>-><a href="#">...</a>

我试过了,但由于某些原因不起作用:

$html = preg_replace("/^.*<.*>/","<.*>",$html);
下面的

推荐答案

将捕获开始标记之前的所有文本并将其存储到一个组中(group1),还将捕获剩余的字符串并将其存储到另一个组中。因此,第二组包含来自开始标记的文本。

(.*)(<w.*)

DEMO

您的php代码将是

<?php
$re = '~(.*)(<w.*)~'; 
$str= '</b>..</cc>..<a href="#">...</a> -> <a href="#">...</a>';
$replacement = "$2";
echo preg_replace($re, $replacement, $str);
?> //=>  <a href="#">...</a>

<?php
$re = '~(?:.*)(<w.*)~'; 
$str= '</p>
<p>Â </p>';
$replacement = "$1";
echo preg_replace($re, $replacement, $str);
?>

说明:

  • (.*)(<w.*)从字符串开头开始捕获,并在找到后跟w单词字符的<时停止捕获。<w之前的字符串存储在组1内,<w之后的字符串存储在组2内(包括<w)。

这篇关于使用正则表达式删除不必要的结束标记的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆