word-boundary - IT屋-程序员软件开发技术分享社区

分词高棉语的可行解决方案?

我正在研究将高棉语(柬埔寨语言)的长行拆分为单个单词(UTF-8)的解决方案.高棉语在单词之间不使用空格.有一些解决方案，但它们远远不够(这里和在这里)，而那些项目已被搁置. 这是需要拆分的高棉语样本行(它们可以比这更长): ចូរសរសើរដល់ទ្រង់ដែលទ្រង់បានប្រទានការទាំងអស់នោះមកដល់រូបអ្នកដោយព្រោះអង្គព្រះយេស៊ូ ..

发布时间：2022-01-02 17:51:39 python nlp word-boundary text-segmentation southeast-asian-languages Python

我在 utf-8 php 文件中有以下 php 代码: var_dump(setlocale(LC_CTYPE, 'de_DE.utf8', 'German_Germany.utf-8', 'de_DE', 'german'));var_dump(mb_internal_encoding());var_dump(mb_internal_encoding('utf-8'));var_dump(mb ..

发布时间：2021-12-28 16:37:32 php regex utf-8 pcre word-boundary PHP

PostgreSQL 正则表达式字边界?

PostgreSQL 是否支持 \b? 我正在尝试 \bAB\b 但它不匹配任何内容，而 (\W|^)AB(\W|$) 匹配.这两个表达本质上是一样的，不是吗? 解决方案 PostgreSQL 使用 \m、\M、\y 和 \Y 作为单词边界: \m 只匹配单词的开头\M 只匹配词尾\y 只匹配单词的开头或结尾\Y 仅匹配不是单词开头或结尾的点请参阅正则表达式约束转义在手册中. ..

发布时间：2021-12-05 21:59:55 regex postgresql word-boundary 其他开发

正则表达式中的单词边界是什么?

我正在尝试使用正则表达式来匹配以空格分隔的数字.我找不到 \b(“词边界")的精确定义.我曾假设 -12 将是一个“整数词".(由 \b\-?\d+\b 匹配)但似乎这不起作用.我很高兴知道 . [我在 Java 1.6 中使用 Java 正则表达式] 示例: Pattern pattern = Pattern.compile("\\s*\\b\\-?\\d+\\s*");字符串加号 ..

发布时间：2021-12-02 23:15:05 regex word-boundary 其他开发

AS3 RegExp 以匹配其中包含边界类型字符的单词

我想匹配一个单词列表，当这些单词是真正的单词时，这很容易.例如 /\b (pop|push) \b/gsx 当针对字符串运行时砰地一声推门，门又弹回来将匹配单词 pop 和 push 而不是 popped. 对于包含通常可以作为单词边界的字符的单词，我需要类似的功能.所以我需要 /\b (reverse!|push) \b/gsx 当针对字符串反推！反向！推只 ..

发布时间：2021-11-12 00:28:05 regex apache-flex actionscript-3 word-boundary 其他开发

AS3 RegExp 以匹配其中包含边界类型字符的单词

我想匹配一个单词列表，当这些单词是真正的单词时，这很容易.例如 /\b (pop|push) \b/gsx 当针对字符串运行时砰地一声推门，门又弹回来将匹配单词 pop 和 push 而不是 popped. 对于包含通常可以作为单词边界的字符的单词，我需要类似的功能.所以我需要 /\b (reverse!|push) \b/gsx 当针对字符串反推！反向！推只 ..

发布时间：2021-11-12 00:23:08 regex apache-flex actionscript-3 word-boundary 其他开发

如何在 Sqlite Android 中实现单词边界?

我想实现以下(全文搜索)， SELECT * FROM tablename where columnname REGEXP '[[::]]' 我只对全文列中的确切字符串(而不仅仅是单词)感兴趣. 我一直在 MySQL 中使用上述 SQL，现在将大部分代码迁移到 Android 应用程序. 但我一直在查看各种帖子，其中提到 Android Sql ..

发布时间：2021-08-23 19:27:37 android regex sqlite word-boundary 移动开发

Python正则表达式单词边界与意外结果

导入重新sstring = "ON Any ON Any"regex1 = re.compile(r''' \bON\bANY\b''', re.VERBOSE)regex2 = re.compile(r'''\b(ON)?\b(Any)?''', re.VERBOSE)regex3 = re.compile(r'''\b(?:ON)?\b(?:Any)?''', re.VERBOSE)对于 re ..

发布时间：2021-07-06 20:46:34 python regex word-boundary Python

如何使用 XSLT 2.0 和 REGEX(没有 \b 单词边界)在文本中查找单词?

我正在尝试使用 REGEX 扫描一串单词并在 XSLT 2.0 样式表中查找特定单词(不区分大小写)的存在. 我有一个单词列表，我希望迭代并确定它们是否存在于给定的字符串中. 我想匹配给定文本中任意位置的一个词，但我不想匹配内一个词(即搜索foo 应该 not 匹配 "food" 并搜索 bar 应该不匹配“rebar"). XSLT 2.0 REGEX 没有字边界(\b)，所以 ..

发布时间：2021-07-06 20:23:53 regex xslt xslt-2.0 word-boundary 其他开发

字边界结束和边缘之间的正则表达式差异

正则表达式说符号\ 分别匹配在一个词的开头和结尾.符号 \b 匹配空字符串一个字的边缘 (一个词的)结束和边缘有什么区别? 解决方案 \b 和 \ 的区别code> 是 \b 可用于 PCRE 正则表达式模式(当您指定 perl=TRUE 时)和 ICU 正则表达式模式(stringr 包). >s = "无处无处">sub("\\", "", s)[1 ..

发布时间：2021-07-06 20:20:47 regex r word word-boundary 其他开发

正则表达式匹配不同 Unicode 脚本之间的边界

正则表达式引擎有一个“零宽度"匹配的概念，其中一些对于查找单词的边缘很有用: \b - 存在于大多数引擎中以匹配单词和非单词字符之间的任何边界 \ - 存在于 Vim 中，只匹配单词开头和单词结尾的边界，某些正则表达式引擎中的一个新概念是 Unicode 类.其中一个类是 script，它可以区分拉丁文、希腊文、西里尔文等.这些例子都是等价的，可以匹配希腊文字系统的任何 ..

发布时间：2021-07-06 20:12:58 regex unicode character-properties word-boundary word-boundaries 其他开发

正则表达式字边界替代

我使用的是标准的 \b 字边界.但是，它并没有像我想要的那样处理点 (.) 字符. 所以下面的正则表达式: \b(\w+)\b 将匹配 cats.dog 中的 cats 和 dogs 如果我有一个字符串表示 cats and dogs don't make猫.狗. 我需要一个词边界替代方案，仅在以下情况下才匹配整个词: 它不包含点(.)字符每边至少用一个空格( ) ..

发布时间：2021-07-06 20:07:53 php regex word-boundary PHP

如何用正则表达式匹配表达式后的第一个单词?

例如，在本文中: Lorem ipsum dolor 坐 amet，consectetur adipiscing 精英.Nunc eutellus vel nunc pretium lacinia.Proin sed lorem.Cras sed ipsum.Nunc a libero quis risus sollicitudin imperdiet. 我想匹配 'ipsum' 后面 ..

发布时间：2021-07-06 19:11:29 regex lookbehind word-boundary 其他开发

正则表达式中的单词边界是什么，\b 是否匹配连字符“-"?

我正在尝试使用正则表达式来匹配以空格分隔的数字.我找不到 \b (“词边界")的精确定义.我曾假设 -12 将是一个“整数词".(由 \b\-?\d+\b 匹配)但似乎这不起作用.我很高兴知道 . [我在 Java 1.6 中使用 Java 正则表达式] 示例: Pattern pattern = Pattern.compile("\\s*\\b\\-?\\d+\\s*");字符串加 ..

发布时间：2021-07-06 18:59:05 regex word-boundary 其他开发

正则表达式只匹配整个单词

我有一个正则表达式，我用它来查找给定内容块中的所有单词，不区分大小写，包含在存储在数据库中的词汇表中.这是我的模式: /($word)/i 问题是，如果我使用 /(Foo)/i 那么像 Food 这样的词会被匹配.单词两侧需要有空格或单词边界. 如果Foo 是句首、句中或句尾的词，我如何修改表达式以仅匹配该词? 解决方案使用单词边界: /\b($word)\b/i 或者如果 ..

发布时间：2021-07-06 18:58:52 regex word-boundary 其他开发

如何使用 grep()/gsub() 查找完全匹配

string = c("apple", "apples", "applez")grep(“苹果"，字符串) 这将为我提供 string 中所有三个元素的索引.但我想要“apple"这个词的精确匹配(即我只想要 grep() 返回索引 1). 解决方案使用词边界 \b 匹配一个单词和非单词字符之间的 a， string = c("apple", "apples", "applez")g ..

发布时间：2021-06-30 19:48:18 r regex word-boundary 其他开发

Oracle REGEXP_LIKE 和字边界

我在用 REGEXP_LIKE 匹配单词边界时遇到问题.以下查询按预期返回单行. 从双选1where regexp_like('DOES TEST WORK HERE','TEST'); 但我也想匹配单词边界.所以，添加“\b"字符给出这个查询从双选1where regexp_like('DOES TEST WORK HERE','\bTEST\b'); 运行它返回零行.有什么想法吗? ..

发布时间：2021-06-12 20:57:24 regex oracle word-boundary 数据库

MySQL REGEXP 只匹配一个边界词，但不包括 html 标签中的匹配

按照这个问答，我还有我得到的结果有点麻烦，例如 REGEXP '>[^:]]' 将仅匹配 'lau' 而不是 'laurent' 这是正确的. REGEXP '>[^:]]' 将匹配 'empowerment' 和 'women'这不是我所追求的. REGEXP '( |>|$)home( | ..

发布时间：2021-06-06 20:10:22 php mysql sql regex word-boundary PHP

mysql: instr 指定单词边界

我想检查一个字符串是否包含一个字段值作为子字符串. select * from mytable where instr("mystring", column_name); 但这不会搜索单词边界. select * from mytable where instr("mystring", concat('[[::]]'); 也不起作用 ..

发布时间：2021-06-05 20:52:19 mysql regex word-boundary 数据库

PHP Regex Word边界排除下划线_

我正在使用正则表达式单词边界\ b，并且尝试在以下 $ sentence 中匹配 foo ，但结果不是我所需要的，下划线杀死了我，我希望下划线成为单词边界，就像连字符或空格一样: $ sentence ="foo_foo_foo foo-foo_foo";X X X是X X 预期: $ sentence ="foo_foo_foo foo-foo_foo";是是是是是是是我的代码 ..

发布时间：2021-05-30 19:56:44 php regex localization preg-match word-boundary PHP

word-boundary相关内容

分词高棉语的可行解决方案?

utf-8中的php正则表达式单词边界匹配

PostgreSQL 正则表达式字边界?

正则表达式中的单词边界是什么?

AS3 RegExp 以匹配其中包含边界类型字符的单词

AS3 RegExp 以匹配其中包含边界类型字符的单词

如何在 Sqlite Android 中实现单词边界?

Python正则表达式单词边界与意外结果

如何使用 XSLT 2.0 和 REGEX(没有 \b 单词边界)在文本中查找单词?

字边界结束和边缘之间的正则表达式差异

正则表达式匹配不同 Unicode 脚本之间的边界

正则表达式字边界替代

如何用正则表达式匹配表达式后的第一个单词?

正则表达式中的单词边界是什么，\b 是否匹配连字符“-"?

正则表达式只匹配整个单词

如何使用 grep()/gsub() 查找完全匹配

Oracle REGEXP_LIKE 和字边界

MySQL REGEXP 只匹配一个边界词，但不包括 html 标签中的匹配

mysql: instr 指定单词边界

PHP Regex Word边界排除下划线_