regex-greedy相关内容
我要使用基于规则的匹配 我有一个类似每个单词的文本,并带有POS: text1= "it_PRON is_AUX a_DET beautiful_ADJ apple_NOUN" text2= "it_PRON is_AUX a_DET beautiful_ADJ and_CCONJ big_ADJ apple_NOUN" 因此,如果我们有一个adj后跟名词(Noun)或一个adj
..
我有一个这样的数据集(见下文),我尝试提取形式为 {variable_number_of_digits}{hyphen}{only_one_digit} 的数字: with mcte as (从双中选择“ILLD/ELKJS/00000000/ELKJS/FHSH"作为地址联合所有从双重选择“ILLD/EFECTE/0116988-7-002/ADFA/ADFG"作为addr联合所有从双中选择“
..
我想 grep 最短的匹配,模式应该是这样的: ......... ... 表示任意字符,输入为多行. 解决方案 您正在寻找非贪婪(或惰性)匹配.要在正则表达式中获得非贪婪匹配,您需要在量词后使用修饰符 ?.例如,您可以将 .* 更改为 .*?. 默认情况下 grep 不支持非贪婪修饰符,但您可以使用 grep -P 来使用 Perl 语法.
..
我正在使用 jQuery.我有一个带有特殊字符块(开始和结束)的字符串.我想从那个特殊字符块中获取文本.我使用正则表达式对象进行字符串内查找.但是,当有两个或更多特殊字符时,如何告诉 jQuery 查找多个结果? 我的 HTML:
Cuộc简PHAPLýgiữa[|公司星期四|nghiệm|] THI张庭[|测试2 |đâyLà测试LAN 2 |]涌khoá
..
我正在尝试使用正则表达式将字符串分成两部分.字符串格式如下: 要提取的文本 我一直在使用 (.*?) ,它们工作正常,但在阅读正则表达式后,我刚开始想知道为什么我需要在表达式中使用 ?.我只是在通过本网站找到它们后才这样做的,所以我不确定有什么区别. 解决方案 这是贪婪量词和非贪婪量词的区别. 考虑输入 101000000000100. 使用1.*1,
..
我使用了这个命令,但它不是广告预期的工作: echo "0+223+141+800+450+1*(106+400)+1*(1822+500)+1*(183+400)" |sed 's/\*\(.*\)+/*\1suma/g' 这是预期的输出: 0+223+141+800+450+1*(106suma400)+1*(1822suma500)+1*(183suma400) 但这就是我得到的:
..
注意: 观察到的行为正确,但起初可能令人惊讶;对我来说是这样,我认为对其他人也可能是这样 - 尽管对于那些非常熟悉正则表达式引擎的人来说可能不是这样. 重复建议的重复项,正则表达式前瞻、后视和原子组,包含关于环视断言的一般信息,但没有解决手头的具体误解,如下面的评论中更详细地讨论. 使用 greedy,根据定义 variable-width 在 积极的后视断言可以表现出令人惊讶的
..
我怀疑这已经在某处得到了回答,但我找不到它,所以... 我需要从较大字符串中的两个标记之间提取一个字符串,其中第二个标记可能会再次出现,意思是...(伪代码...) myString = "A=abc;B=def_3%^123+-;C=123;";myB = getInnerString(myString, "B=", ";" ) ;方法 getInnerString(inStr, sta
..
我一直在使用以下站点来测试 PHP 正则表达式,因此我不必经常上传:http://www.spaweditor.com/scripts/regex/index.php 我正在使用以下正则表达式: /(.*?)\.{3}/ 在以下字符串上(不替换): 非重要数据...重要数据...更重要数据 并且 preg_replace 正在返回: 更重要的数据 但我希望它回来: 重要数据..
..
我注意到有 3 类不同的量词:贪婪、懒惰(即非贪婪)和占有欲. 我知道,笼统地说,贪婪量词会尝试通过首先读取整个输入字符串来获得最长匹配,然后在尝试不断失败时逐个截断字符;lazy 量词尝试通过首先读取空字符串来获得最短匹配,如果尝试一直失败,然后一个一个地添加字符;占有量词尝试与贪婪量词相同的方式,但如果第一次尝试失败,它们将停止匹配. 但是,我不确定上述内容是如何在“内部"实施的,
..
代码: str = ' A B'打印(re.sub(r'\w$', '', str)) 本应返回
A,但返回一个空字符串''! 有什么建议吗? 解决方案 贪婪是从左到右起作用的,但不是相反.它的基本意思是“除非匹配失败,否则不匹配".这是发生了什么: 正则表达式引擎匹配字符串开头的 . .*? 暂时忽略了,很懒. 尝试匹配>,并成功.
..
我正在阅读正则表达式参考,我在想?和 ??人物.你能用一些例子向我解释它们的用处吗?我不太了解它们. 谢谢 解决方案 ? 和 ?? 之间的主要区别在于他们的懒惰.?? 是懒惰的,? 不是. 假设您想在文本正文中搜索单词“car",但您不想仅限于单数的“car";您还想匹配复数“汽车". 这是一个例句: 我拥有三辆车. 现在,如果我想匹配单词“car"而我只想得
..
给定一个输入字符串 fooxxxxxxfooxxxboo 我正在尝试编写一个匹配 fooxxxboo 的正则表达式,即从第二个 foo 开始到最后一个 boo. 我尝试了以下 foo.*?boo 匹配完整的字符串 fooxxxxxxfooxxxboo foo.*boo 也匹配完整的字符串 fooxxxxxxfooxxxboo 我读了这篇贪婪与不情愿与占有量词 并且我理解它们
..
我有一个包含大量标记的大 HTML 文件,如下所示: 这里的内容
我正在尝试进行 Vim 搜索和替换以摆脱所有 class="" 和 style="" 但我遇到了麻烦使匹配变得不贪婪. 我的第一次尝试是这样 %s/style=".*?"//
..
我正在测试一个正则表达式模式匹配信用卡的应用程序,然后应该突出显示这些数字.我正在使用网站 http://regexpal.com/ 为我的测试创建测试信用卡号.我的要求是拥有有效的信用卡号码,它们之间可以有“-"和/或“,".我没有成功建立这样的号码,因为我使用该网站对其进行测试 http://regexpal.com. 我需要一些具有以下场景的信用号码 有效的信用卡号,任何数
..
我需要捕获多个相同模式的组.假设,我有以下字符串: 你好,那里,世界 我写了以下模式 ^(?:([A-Z]+),?)+$ 我想要它做的是捕获每个单词,以便第 1 组是:“HELLO",第 2 组是“THERE";并且第3组是“世界".我的正则表达式实际捕获的只是最后一个,即“WORLD". 我正在测试我的正则表达式 here 我想将它与 Swift 一起使用(也许 Swift 中有一
..
我如何制作像 "(.*)" 这样的 python 正则表达式,这样,给定 "a (b) c (d) e" python 匹配 "b" 而不是 "b) c (d"? 我知道我可以使用 "[^)]" 而不是 ".",但我正在寻找一个更通用的解决方案,使我的正则表达式保持不变小清洁工.有什么办法可以告诉python“嘿,尽快匹配这个"? 解决方案 你寻求全能的*? 来自文档,贪婪与非
..
我有一个可能很大的文本块来搜索 [[...]] 的实例,其中 ... 可以是任何东西,包括其他括号(尽管它们不能嵌套;[[ 结束匹配后的 ]] 的第一个实例). 我能想到两种方法来匹配这段文字: 使用非贪婪限定符:/\[\[.+?\]\]/ 使用前瞻:/\[\[(?:(?!\]\]).)+\]\]/ 从性能的角度来看,一个选择是否本质上比另一个更好(我认为第一个可能更具可读性)
..
我正在尝试了解正则表达式中的递归,并对 PCRE 风格中的概念有基本的了解.我想打破一个字符串: 鹅(群)狗(包) 进入: Full Match: Geese (Flock) Dogs (Pack)第 1 组:鹅(群)第 2 组:鹅第 3 组:(群)第 4 组:狗(包)第 5 组:狗第 6 组:(包) 我知道这两个正则表达式都没有做到这一点,但我更好奇为什么 首先 模式有效,但 secon
..
我正在尝试使用 sed 来清理 URL 行以仅提取域. 所以来自: http://www.suepearson.co.uk/product/174/71/3816/ 我想要: http://www.suepearson.co.uk/ (有无斜杠都无所谓) 我试过了: sed 's|\(http:\/\/.*?\/\).*|\1|' and(转义非贪婪量词) sed 's
..