agrep相关内容
我在 R 中使用了 'agrep' 函数,它返回一个匹配向量.我想要一个类似于 agrep 的函数,它只返回最佳匹配,或者如果有关系则返回最佳匹配.目前,我在结果向量的每个元素上使用包 'cba' 中的 'sdist()' 函数执行此操作,但这似乎非常多余. /edit: 这是我目前使用的功能.我想加快速度,因为两次计算距离似乎是多余的. 图书馆(cba)单词
..
我有一个地址列表.这些地址是由不同的用户输入的,因此写入相同地址的方式存在很大差异.例如, "andheri at weh pump house", "andheri pump house","andheri pump house(mt)","weh andheri pump house","weh andheri pump house et","weh, nr. pump屋" 上面的向量有
..
我尝试合并两个data.tables,但是由于股票名称的拼写不同,我丢失了大量的数据点.因此,我正在寻找模糊合并,而不是精确匹配. library("data.table")dt1 = data.table(名称= c("ASML HOLDING","ABN AMRO GROUP"),A = c(1,2))dt2 = data.table(名称= c("ASML HOLDING NV","AB
..
agrep给出错误 agrep:模式字符串太长(具有32个字符),而模式字符串中有一个完整的stop(.)则不然. 我想比较(大约)两个字符串,所以我为此使用了agrep,但它给出了一个错误 agrep:pattern too long(具有> 32个字符).但是我发现,如果模式字符串中没有句号,它不会给出错误(为什么?) `echo“敏捷的棕色狐狸跳过了那只懒惰的狗."|agr
..
我必须将数据集A中的列a匹配到数据集B中的列b. 但是不同的变量不是在单独的字段(a,b,c列)中,而是在同一个字段中. 我一直在查看软件包 RecordLinkage & fastLink ,它们可以很好地将字段分隔开. 单独的字段: # make dataframe 1 fname
..
我在一个长列表中包含成千上万个名称的数据框中有一个列表.许多名称之间的差异很小,因此略有不同.我想找到一种匹配这些名称的方法.例如: names
..
使用R,我尝试匹配由年份和城市构成的数据集中的人的名字.由于某些拼写错误,无法进行完全匹配,因此我尝试使用agrep()来模糊匹配名称. 数据集的样本块的结构如下: df
..
R的新手.我想通过创建一个变量(是/否)来创建测试,以检查名字或姓氏是否与电子邮件地址模糊匹配.如果是这样,请在该行后面附加一个“是"变量. 数据示例: id firstname lastname email address match 1 patrick boyles patrickb@gmail.com yes 2 zeke cosmos zeke@gmail.com yes 3
..
我在R中使用'agrep'函数,它返回一个匹配的向量。我想要一个类似于agrep的函数,只返回最佳匹配,或者最好的匹配,如果有tie。目前,我使用'cba'包中的'sdist()'函数在结果向量的每个元素上执行此操作,但这看起来非常多余。 编辑:这里是我目前使用的功能。 图书馆(cba) 单词
..