agrep - IT屋-程序员软件开发技术分享社区

agrep:只返回最佳匹配

我在 R 中使用了 'agrep' 函数，它返回一个匹配向量.我想要一个类似于 agrep 的函数，它只返回最佳匹配，或者如果有关系则返回最佳匹配.目前，我在结果向量的每个元素上使用包 'cba' 中的 'sdist()' 函数执行此操作，但这似乎非常多余. /edit: 这是我目前使用的功能.我想加快速度，因为两次计算距离似乎是多余的. 图书馆(cba)单词 ..

发布时间：2021-12-22 19:44:26 r text character string-matching agrep 其他开发

我有一个地址列表.这些地址是由不同的用户输入的，因此写入相同地址的方式存在很大差异.例如， "andheri at weh pump house", "andheri pump house","andheri pump house(mt)","weh andheri pump house","weh andheri pump house et","weh, nr. pump屋" 上面的向量有 ..

发布时间：2021-06-14 20:25:29 r pattern-matching stringdist agrep 其他开发

R:使用agrep和data.table进行模糊合并

我尝试合并两个data.tables，但是由于股票名称的拼写不同，我丢失了大量的数据点.因此，我正在寻找模糊合并，而不是精确匹配. library("data.table")dt1 = data.table(名称= c("ASML HOLDING"，"ABN AMRO GROUP")，A = c(1,2))dt2 = data.table(名称= c("ASML HOLDING NV"，"AB ..

发布时间：2021-04-28 19:39:20 r data.table agrep 其他开发

如何修复错误agrep:模式过长(具有32个字符)，如果字符串中没有句号，则不会显示错误?

agrep给出错误 agrep:模式字符串太长(具有32个字符)，而模式字符串中有一个完整的stop(.)则不然. 我想比较(大约)两个字符串，所以我为此使用了agrep，但它给出了一个错误 agrep:pattern too long(具有> 32个字符).但是我发现，如果模式字符串中没有句号，它不会给出错误(为什么?) `echo“敏捷的棕色狐狸跳过了那只懒惰的狗."|agr ..

发布时间：2021-04-14 20:08:59 bash agrep 其他开发

R:记录链接问题，所有字段合并在1列中

我必须将数据集A中的列a匹配到数据集B中的列b. 但是不同的变量不是在单独的字段(a，b，c列)中，而是在同一个字段中. 我一直在查看软件包 RecordLinkage & fastLink ，它们可以很好地将字段分隔开. 单独的字段: # make dataframe 1 fname ..

发布时间：2020-07-16 19:39:28 r regex record-linkage agrep 其他开发

单个列表中的近似字符串匹配-r

我在一个长列表中包含成千上万个名称的数据框中有一个列表.许多名称之间的差异很小，因此略有不同.我想找到一种匹配这些名称的方法.例如: names ..

发布时间：2020-07-16 19:39:24 r string-matching agrep 其他开发

通过名称的模糊匹配来创建唯一的ID(通过使用R的agrep)

使用R，我尝试匹配由年份和城市构成的数据集中的人的名字.由于某些拼写错误，无法进行完全匹配，因此我尝试使用agrep()来模糊匹配名称. 数据集的样本块的结构如下: df ..

发布时间：2020-06-15 19:28:40 r string-matching fuzzy agrep 其他开发

R多重模糊匹配agrep创建变量

R的新手.我想通过创建一个变量(是/否)来创建测试，以检查名字或姓氏是否与电子邮件地址模糊匹配.如果是这样，请在该行后面附加一个“是"变量. 数据示例: id firstname lastname email address match 1 patrick boyles patrickb@gmail.com yes 2 zeke cosmos zeke@gmail.com yes 3 ..

发布时间：2020-05-06 09:32:24 r match agrep 其他开发

agrep：只返回最匹配的

我在R中使用'agrep'函数，它返回一个匹配的向量。我想要一个类似于agrep的函数，只返回最佳匹配，或者最好的匹配，如果有tie。目前，我使用'cba'包中的'sdist（）'函数在结果向量的每个元素上执行此操作，但这看起来非常多余。编辑：这里是我目前使用的功能。图书馆（cba）单词 ..

发布时间：2016-11-18 15:31:58 r text character string-matching agrep 其他开发

agrep相关内容