word-boundary相关内容

分词高棉语的可行解决方案?

我正在研究将高棉语(柬埔寨语言)的长行拆分为单个单词(UTF-8)的解决方案.高棉语在单词之间不使用空格.有一些解决方案,但它们远远不够(这里 和 在这里),而那些项目已被搁置. 这是需要拆分的高棉语样本行(它们可以比这更长): ចូរសរសើរដល់ទ្រង់ដែលទ្រង់បានប្រទានការទាំងអស់នោះមកដល់រូបអ្នកដោយព្រោះអង្គព្រះយេស៊ូ ..

PostgreSQL 正则表达式字边界?

PostgreSQL 是否支持 \b? 我正在尝试 \bAB\b 但它不匹配任何内容,而 (\W|^)AB(\W|$) 匹配.这两个表达本质上是一样的,不是吗? 解决方案 PostgreSQL 使用 \m、\M、\y 和 \Y 作为单词边界: \m 只匹配单词的开头\M 只匹配词尾\y 只匹配单词的开头或结尾\Y 仅匹配不是单词开头或结尾的点 请参阅正则表达式约束转义 在手册中. ..
发布时间:2021-12-05 21:59:55 其他开发

正则表达式中的单词边界是什么?

我正在尝试使用正则表达式来匹配以空格分隔的数字.我找不到 \b(“词边界")的精确定义.我曾假设 -12 将是一个“整数词".(由 \b\-?\d+\b 匹配)但似乎这不起作用.我很高兴知道 . [我在 Java 1.6 中使用 Java 正则表达式] 示例: Pattern pattern = Pattern.compile("\\s*\\b\\-?\\d+\\s*");字符串加号 ..
发布时间:2021-12-02 23:15:05 其他开发

AS3 RegExp 以匹配其中包含边界类型字符的单词

我想匹配一个单词列表,当这些单词是真正的单词时,这很容易.例如 /\b (pop|push) \b/gsx 当针对字符串运行时 砰地一声推门,门又弹回来 将匹配单词 pop 和 push 而不是 popped. 对于包含通常可以作为单词边界的字符的单词,我需要类似的功能.所以我需要 /\b (reverse!|push) \b/gsx 当针对字符串 反推!反向!推 只 ..
发布时间:2021-11-12 00:28:05 其他开发

AS3 RegExp 以匹配其中包含边界类型字符的单词

我想匹配一个单词列表,当这些单词是真正的单词时,这很容易.例如 /\b (pop|push) \b/gsx 当针对字符串运行时 砰地一声推门,门又弹回来 将匹配单词 pop 和 push 而不是 popped. 对于包含通常可以作为单词边界的字符的单词,我需要类似的功能.所以我需要 /\b (reverse!|push) \b/gsx 当针对字符串 反推!反向!推 只 ..
发布时间:2021-11-12 00:23:08 其他开发

如何在 Sqlite Android 中实现单词边界?

我想实现以下(全文搜索), SELECT * FROM tablename where columnname REGEXP '[[::]]' 我只对全文列中的确切字符串(而不仅仅是单词)感兴趣. 我一直在 MySQL 中使用上述 SQL,现在将大部分代码迁移到 Android 应用程序. 但我一直在查看各种帖子,其中提到 Android Sql ..
发布时间:2021-08-23 19:27:37 移动开发

如何使用 XSLT 2.0 和 REGEX(没有 \b 单词边界)在文本中查找单词?

我正在尝试使用 REGEX 扫描一串单词并在 XSLT 2.0 样式表中查找特定单词(不区分大小写)的存在. 我有一个单词列表,我希望迭代并确定它们是否存在于给定的字符串中. 我想匹配给定文本中任意位置的一个词,但我不想匹配内一个词(即搜索foo 应该 not 匹配 "food" 并搜索 bar 应该不匹配“rebar"). XSLT 2.0 REGEX 没有字边界(\b),所以 ..
发布时间:2021-07-06 20:23:53 其他开发

字边界结束和边缘之间的正则表达式差异

正则表达式 说 符号\ 分别匹配在一个词的开头和结尾.符号 \b 匹配空字符串一个字的边缘 (一个词的)结束和边缘有什么区别? 解决方案 \b 和 \ 的区别code> 是 \b 可用于 PCRE 正则表达式模式(当您指定 perl=TRUE 时)和 ICU 正则表达式模式(stringr 包). >s = "无处无处">sub("\\", "", s)[1 ..
发布时间:2021-07-06 20:20:47 其他开发

正则表达式匹配不同 Unicode 脚本之间的边界

正则表达式引擎有一个“零宽度"匹配的概念,其中一些对于查找单词的边缘很有用: \b - 存在于大多数引擎中以匹配单词和非单词字符之间的任何边界 \ - 存在于 Vim 中,只匹配单词开头和单词结尾的边界, 某些正则表达式引擎中的一个新概念是 Unicode 类.其中一个类是 script,它可以区分拉丁文、希腊文、西里尔文等.这些例子都是等价的,可以匹配希腊文字系统的任何 ..

正则表达式字边界替代

我使用的是标准的 \b 字边界.但是,它并没有像我想要的那样处理点 (.) 字符. 所以下面的正则表达式: \b(\w+)\b 将匹配 cats.dog 中的 cats 和 dogs 如果我有一个字符串表示 cats and dogs don't make猫.狗. 我需要一个词边界替代方案,仅在以下情况下才匹配整个词: 它不包含点(.)字符 每边至少用一个空格( ) ..
发布时间:2021-07-06 20:07:53 PHP

正则表达式中的单词边界是什么,\b 是否匹配连字符“-"?

我正在尝试使用正则表达式来匹配以空格分隔的数字.我找不到 \b (“词边界")的精确定义.我曾假设 -12 将是一个“整数词".(由 \b\-?\d+\b 匹配)但似乎这不起作用.我很高兴知道 . [我在 Java 1.6 中使用 Java 正则表达式] 示例: Pattern pattern = Pattern.compile("\\s*\\b\\-?\\d+\\s*");字符串加 ..
发布时间:2021-07-06 18:59:05 其他开发

正则表达式只匹配整个单词

我有一个正则表达式,我用它来查找给定内容块中的所有单词,不区分大小写,包含在存储在数据库中的词汇表中.这是我的模式: /($word)/i 问题是,如果我使用 /(Foo)/i 那么像 Food 这样的词会被匹配.单词两侧需要有空格或单词边界. 如果Foo 是句首、句中或句尾的词,我如何修改表达式以仅匹配该词? 解决方案 使用单词边界: /\b($word)\b/i 或者如果 ..
发布时间:2021-07-06 18:58:52 其他开发

如何使用 grep()/gsub() 查找完全匹配

string = c("apple", "apples", "applez")grep(“苹果",字符串) 这将为我提供 string 中所有三个元素的索引.但我想要“apple"这个词的精确匹配(即我只想要 grep() 返回索引 1). 解决方案 使用词边界 \b 匹配一个单词和非单词字符之间的 a, string = c("apple", "apples", "applez")g ..
发布时间:2021-06-30 19:48:18 其他开发

Oracle REGEXP_LIKE 和字边界

我在用 REGEXP_LIKE 匹配单词边界时遇到问题.以下查询按预期返回单行. 从双选1where regexp_like('DOES TEST WORK HERE','TEST'); 但我也想匹配单词边界.所以,添加“\b"字符给出这个查询 从双选1where regexp_like('DOES TEST WORK HERE','\bTEST\b'); 运行它返回零行.有什么想法吗? ..
发布时间:2021-06-12 20:57:24 数据库

mysql: instr 指定单词边界

我想检查一个字符串是否包含一个字段值作为子字符串. select * from mytable where instr("mystring", column_name); 但这不会搜索单词边界. select * from mytable where instr("mystring", concat('[[::]]'); 也不起作用 ..
发布时间:2021-06-05 20:52:19 数据库

PHP Regex Word边界排除下划线_

我正在使用正则表达式单词边界\ b,并且尝试在以下 $ sentence 中匹配 foo ,但结果不是我所需要的,下划线杀死了我,我希望下划线成为单词边界,就像连字符或空格一样: $ sentence ="foo_foo_foo foo-foo_foo";X X X是X X 预期: $ sentence ="foo_foo_foo foo-foo_foo";是是是是是是是 我的代码 ..
发布时间:2021-05-30 19:56:44 PHP