正则表达式:删除空格,但不从<>标记中删除 [英] Regex: remove whitespaces but not from < > tag

查看:56
本文介绍了正则表达式:删除空格,但不从<>标记中删除的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我一直在为regexp而苦苦挣扎很久了..我需要的是从字符串中删除所有空格,而不是从<;标记中删除(例如。a HREF标记或img src标记必须包含空格)。

我正在用PHP做这件事,并且我在尝试不同的解决方案(我对regexp完全是个新手,这让我很困惑)。 到目前为止,这是我的代码部分:

$text=$_POST["text"];
$pattern = '(<.+?>)|s'; 
$replace = '';
echo preg_replace( $pattern, $replace, $text );

这有什么问题?::(

推荐答案

首先,您忘记了正则表达式周围的分隔符。然后,正则表达式/(<.+?>)|s/匹配一个标记或空格,因此您的preg_replace()用空字符串替换其中一个

至少可以说,使用正则表达式操作HTML是困难的。如果您可以确保文件中除分隔标记的位置外不会有任何<>,则可以查找最接近的括号(如果有)是开始括号的空格:

$result = preg_replace(
    '/s+     # Match one or more whitespace characters
    (?!       # but only if it is impossible to match...
     [^<>]*   # any characters except angle brackets
     >        # followed by a closing bracket.
    )         # End of lookahead
    /x', 
    '', $subject);

这篇关于正则表达式:删除空格,但不从&lt;&gt;标记中删除的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆