在字符串向量的元素之间获取最小的共享部分 [英] Get minimal shared part between elements of string's vector

查看：50 发布时间：2021/5/16 19:49:46 string r intersection text-mining fuzzy-search

本文介绍了在字符串向量的元素之间获取最小的共享部分的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

具有字符串向量列表:

xx <- c("concord wanderer basic set air snug beige",
  "concord wanderer basic set air snug black noir", 
  "concord wanderer basic set air snug blue bleu", 
  "concord wanderer basic set air snug brown marron", 
  "concord wanderer basic set air snug green vert", 
   "concord wanderer basic set air snug grey gris", 
   "concord wanderer basic set air snug red rouge", 
   "concord wanderer basic set air snug rose" )

我试图使向量元素之间的共享部分最小化，例如，在这里我应该得到:

I tried to get minimal shared part between elements of the vector, for example, here I should get:

"concord wanderer basic set air snug"

xx是先前过程的结果，所以我确定元素之间存在共享部分.但是删除的部分并不总是在字符串的结尾.

xx is a result of a previous process, so I am sure that there is a shared part between the elements. But the removed part is not always at the end of he strings.

使用 strsplit 和`table 我得到了部分解决方案，但这有点棘手，我失去了原来的单词顺序:

Using strsplit and `table I get this partial solution, but it is a little bit tricky and I loose the original order of words:

table_x <- table(unlist(strsplit(xx,' ')))
paste(names(table_x[table_x==max(table_x)]),collapse=' ')
[1] "air basic concord set snug wanderer"

我很确定有更好的解决方案.我尝试使用 agrep 或 adist ，但没有成功.

I am pretty sure that there is better solution. I tried with agrep or adist but without a lot of success.

在字符串向量的元素之间获取最小的共享部分 [英] Get minimal shared part between elements of string's vector

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

在字符串向量的元素之间获取最小的共享部分 [英] Get minimal shared part between elements of string&#39;s vector

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

在字符串向量的元素之间获取最小的共享部分 [英] Get minimal shared part between elements of string's vector

登录关闭