从regexp获得的反向引用多于圆括号 [英] Get more backreferences from regexp than parenthesis

查看:20
本文介绍了从regexp获得的反向引用多于圆括号的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

好的,这真的很难用英语解释,所以我就举个例子。

我将拥有以下格式的字符串:

key-value;key1-value;key2-...

我需要将数据提取为数组

array('key'=>'value','key1'=>'value1', ... )

我计划使用regexp来实现(大部分)此功能,并编写了以下正则表达式:

/^(w+)-([^-;]+)(?:;(w+)-([^-;]+))*;?$/

使用preg_match和此代码:

for ($l = count($matches),$i = 1;$i<$l;$i+=2) {
    $parameters[$matches[$i]] = $matches[$i+1];
}
但是,regexp显然只返回4个反向引用,即输入字符串的第一个和最后一个键值对。有什么办法可以绕过这件事吗?我知道我可以使用正则表达式来测试字符串的正确性,并在循环中使用PHP的explode并获得完美的结果,但我真的很好奇正则表达式是否可以这样做。

简而言之,我需要通过正则表达式在字符串中捕获任意数量的key-value;对。

推荐答案

您可以在提取匹配项时使用先行查找来验证输入:

/G(?=(?:w++-[^;-]++;?)++$)(w++)-([^;-]++);?/

(?=(?:w++-[^;-]++;?)++$)是验证部分。如果输入无效,匹配将立即失败,但每次应用正则表达式时仍会计算先行。为了使它(以及正则表达式的其余部分)与键-值对保持同步,我使用G将每个匹配锚定到前一个匹配结束的位置。

这样,如果第一次先行成功,则保证以后每次都会成功。显然,它的效率并不像它可能达到的那样高,但这可能不是问题--只有您的测试才能确定。

如果先行查找失败,preg_match_all()将返回0(FALSE)。如果成功,将在数组数组中返回匹配项:一个数组用于完整的键-值对,一个用于键,一个用于值。

这篇关于从regexp获得的反向引用多于圆括号的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆